概述
卷积神经网络(CNNs)是一类专门用于处理结构化网格数据(如图像)的神经网络。CNN通过局部连接性和参数共享来有效提取层次化的特征。
1. 神经元与感受野
1.1 神经元功能的简化
- 每个神经元专注于特定的感受野(Receptive Field),这种局部化特性使得神经网络可以检测局部特征,而不是处理整个图像。
.
1.2 典型的卷积层设置
通道(Channels):输入数据通常具有多个通道(例如 RGB 图像)。
核大小(Kernel Size):定义核(滤波器)的大小(例如 3x3),决定了神经元观察的图像范围。
神经元重叠:多个神经元可以覆盖相同的感受野,提高检测准确度。
步幅(Stride):定义核如何在图像上移动,允许感受野的重叠。
填充(Padding):如零填充技术确保卷积操作可以在图像边缘应用。
2. 参数共享
2.1 参数共享的效率
- 冗余神经元:相似的感受野中可以共享参数,而不是为每一个感受野分配不同的神经元,提升了效率。
2.2 共享机制
拥有相同感受野的神经元不共享参数,允许专门化。
在不同位置观察相似模式的神经元可以共享参数,降低模型大小与复杂性。
3. 卷积层的优点
局部模式检测:许多图像中的模式都比整个图像小,卷积层可专注于局部特征。
平移不变性:相同的模式可在图像不同部分出现,增强网络的泛化能力。
降低过拟合:卷积层通常比全连接层参数更少,降低了过拟合的风险。
图像专用:专为图像与视频数据设计,卷积层可以更有效地提取特征。
4. 池化层
4.1 池化的目的
- 池化层减少特征图的维度,帮助保留重要特征,同时降低计算负担。
4.2 池化类型
- 最大池化(Max Pooling):从定义的窗口中选择最大值,保留关键特征并缩小尺寸。
5. CNN的结构
5.1 架构
- 一个典型的CNN由交替的卷积和池化层组成,最后是全连接层,根据提取的特征进行分类。
6. 滤波器与特征图
6.1 滤波器(Filters)
- 滤波器是CNN的核心组件,每个滤波器设计用于检测局部区域中的特定模式(例如跨越所有通道的3x3像素区域)。
6.2 生成特征图
- 每个滤波器在输入图像上进行卷积,生成特征图,显示特定模式在图像中的分布。
6.3 层次特征学习
- 随着网络加深,滤波器能够捕捉到更复杂的模式,使模型学习更高级的特征。
7. 神经元与滤波器功能的比较
- 具有不同感受野且共享参数的神经元的工作方式类似于滤波器在输入图像上进行卷积,这种设计结合了参数共享与局部特征检测的优势。
8. 总结
卷积神经网络(CNNs)是一种适用于图像处理的强大架构,利用局部化检测、参数共享和层次特征提取,在图像分类和物体检测等任务中表现优异。