Notes on Section 6.5
在处理图像信息的时候,我们希望如下的操作:
“逐渐降低隐藏表示的空间分辨率、聚集信息,随着我们在神经网络中层叠的上升,每个神经元对其敏感的感受野(输入)就越大。”
我们现在假想一个任务,比如说从一个图像中分辨出某一个事物,那么,我们的最后一层的神经元理应对整个输入具有全局敏感。同时降低出对于空间位置采样的敏感性
这一节,我们将引入汇聚(pooling)层,也称为池化层
其具有双重目的:降低卷积层对位置的敏感性,同时降低对空间降采样表示的敏感性。
以下我们定义一个池化层

这里我么可以发现池化层和卷积层的关联,首先就是都有一个类似卷积核的窗口(pool size)以及步长(stride),不过区别在于,池化层没有需要训练的参数而更像一个非线性函数,其运作逻辑在图中体现了两种,分别是取窗口内最大值和平均值

从这个部分可以看出来,其运作逻辑和卷积层是非常类同的
在接受多个通道的时候,池化层在每个输入通道上单独运算,所以说输入通道数和输出通道数也是相同的
通过对池化层运作逻辑的研究,我们可以总结出池化层的一些功能:
**取区域最值/均值-平移不变性-**解决像素位移导致结果巨变的问题
**尺寸下采样-增大感受野-**有利于整体观测
**丢弃部分空间信息-抽象化与降噪-**提高模型的鲁棒性,减少计算负担
- Title: Notes on Section 6.5
- Author: bobown_yao
- Created at : 2026-01-10 00:00:00
- Updated at : 2026-01-17 16:19:05
- Link: https://bobownyao.github.io/2026/01/10/Notes-on-Section-6-5/
- License: All Rights Reserved © bobown_yao