Notes on Section 6.4
这一节我们讨论的是多通道输入和多通道输出的相关处理
先看输入,其实本质上和单通道是一样的,我们增加了维度信息,而相乘模式还是元素对对应位置相乘。不过需要注意的是,当我们改变了输入通道结构,卷积核的结构也要相应的改变

以上我们讨论的限于单通道输出,但是在实际应用中,多通道输出是非常重要的
“在最流行的神经网络架构中,随着神经网络层数的加深,我们常会增加输出通道的维数,通过减少空间分辨率以获得更大的通道深度。直观地说,我们可以将每个通道看作对不同特征的响应。”
以下构建了一个三通道输出的卷积核(输入是双通道,2*2卷积核)

1*1卷积层
这样结构的卷积层,显然不能提取周围像素的特征,但是像素内的通道之间的计算依然存在
这样一个层有如下的一些作用:
灵活的升维与降维(减少/增加参数量)
跨通道的信息交互(无干扰)
减少计算量
搭配非线性激活函数使用(比如ReLU)
以下是书中的描述

- Title: Notes on Section 6.4
- Author: bobown_yao
- Created at : 2026-01-09 00:00:00
- Updated at : 2026-01-17 16:19:05
- Link: https://bobownyao.github.io/2026/01/09/Notes-on-Section-6-4/
- License: All Rights Reserved © bobown_yao