Notes on Section 6.3
本节我们将介绍填充(padding)和步幅(stride)
假设以下情景: 有时,在应用了连续的卷积之后,我们最终得到的输出远小于输入大小。这是由于卷积核的宽度和高度通常大于1所导致的。比如,一个240*240像素的图像,经过层的卷积后,将减少到200*200像素。如此一来,原始图像的边界丢失了许多有用信息。而填充是解决此问题最有效的方法; 有时,我们可能希望大幅降低图像的宽度和高度。例如,如果我们发现原始的输入分辨率十分冗余。步幅则可以在这类情况下提供帮助。
通过如下实现,注意到当我们给kernel_size/padding/stride填入一个参数的时候,默认会广播成正方形(即x->x*x ),如果给两个参数,就是行/列

当我们希望一个奇数核对应图的每个位置都被作为中心计算时,padding=(kernel_size-1)/2
默认条件下,卷积窗口每次滑动一个元素,不过我们可以调整这一距离来减少采样次数,提高训练效率。

综上,填充和步幅可用于有效的调整数据的维度
- Title: Notes on Section 6.3
- Author: bobown_yao
- Created at : 2026-01-07 00:00:00
- Updated at : 2026-01-17 16:19:05
- Link: https://bobownyao.github.io/2026/01/07/Notes-on-Section-6-3/
- License: All Rights Reserved © bobown_yao