我正在Keras学习CNN可训练参数计算。我只是想知道为什么我们将滤波器计算视为可训练参数?因为卷积过程是一个固定计算(即矩阵乘法),没有什么需要更新(可训练)。我知道有一个公式,但为什么我们将其视为可训练参数。例如:在第一个conV2D中,图像大小为10x10x1,滤波器为3 x 3,1个滤波器,参数为10(3x3+1)。亚历克斯
mgdq6dx11#
在卷积层中有一个3x3(x1)内核(x1,因为您的图像只有一个通道)。卷积层内核中的值是 learned 参数。除了内核本身,卷积层(可能,通常是可选的)具有可学习的偏差参数(这是你公式中的+1)。你的问题有点难以理解,但在您的设置中,您似乎要求该层学习10个不同卷积核的参数(每个都有偏差),因此有10(3 × 3 +1)个学习参数。
1条答案
按热度按时间mgdq6dx11#
在卷积层中有一个3x3(x1)内核(x1,因为您的图像只有一个通道)。卷积层内核中的值是 learned 参数。除了内核本身,卷积层(可能,通常是可选的)具有可学习的偏差参数(这是你公式中的+1)。你的问题有点难以理解,但在您的设置中,您似乎要求该层学习10个不同卷积核的参数(每个都有偏差),因此有10(3 × 3 +1)个学习参数。