keras Conv2D滤波器和CNN架构

1tuwyuhd  于 2023-01-30  发布在  其他
关注(0)|答案(1)|浏览(175)

我目前正在攻读本科,我正在研究CNN模型来识别Telegu字符。
本问题分为两部分,
1.我有一个(32,32,1)形状的Telegu字符图像,我想训练我的CNN模型来识别字符。那么,我的模型架构应该是什么,以及如何决定架构,没有参数和隐藏层。我知道我的情况与手写数字识别完全相同,但我想知道如何决定这些参数。在建立这样的架构方面有什么常见的做法吗?
1.操作Conv2D(32,(5,5))意味着32个大小为5x5的过滤器应用于输入,我的问题是这些过滤器是相同还是不同,如果不同,初始化什么类型的过滤器,谁决定它们?
我试着上网,但无论我走到哪里,我得到的答案都是Conv2D操作在输入上应用过滤器并进行卷积操作。

cqoc49vn

cqoc49vn1#

要决定哪个模型架构是最好的,你需要实验。这是唯一的方法。正如你想要分类,VGG架构将是一个很好的起点,我相信。你需要实验的参数数量,因为它取决于你的问题。你可以使用Keras调谐器:https://keras.io/keras_tuner/对于内核初始化,据我所知Keras中的卷积层使用Glorot Uniform Initialization,但您可以通过使用kernel_initializer参数来更改它。长话短说,卷积层使用分布函数初始化,随着训练的进行,过滤器会更改内部的值,这就是学习过程。https://keras.io/api/layers/initializers我忘了告诉你,我建议VGG架构,但在某种程度上你缩小了模型很多。你的输入形状很少,所以如果你的模型太深,你会过拟合真的很快。

相关问题