Notes on Section 6.4

bobown_yao

这一节我们讨论的是多通道输入和多通道输出的相关处理

先看输入,其实本质上和单通道是一样的,我们增加了维度信息,而相乘模式还是元素对对应位置相乘。不过需要注意的是,当我们改变了输入通道结构,卷积核的结构也要相应的改变

Image: image_001

以上我们讨论的限于单通道输出,但是在实际应用中,多通道输出是非常重要的

“在最流行的神经网络架构中,随着神经网络层数的加深,我们常会增加输出通道的维数,通过减少空间分辨率以获得更大的通道深度。直观地说,我们可以将每个通道看作对不同特征的响应。”

以下构建了一个三通道输出的卷积核(输入是双通道,2*2卷积核)

Image: image_002

1*1卷积层

这样结构的卷积层,显然不能提取周围像素的特征,但是像素内的通道之间的计算依然存在

这样一个层有如下的一些作用:

灵活的升维与降维(减少/增加参数量)

跨通道的信息交互(无干扰)

减少计算量

搭配非线性激活函数使用(比如ReLU)

以下是书中的描述

Image: image_003

  • Title: Notes on Section 6.4
  • Author: bobown_yao
  • Created at : 2026-01-09 00:00:00
  • Updated at : 2026-01-17 16:19:05
  • Link: https://bobownyao.github.io/2026/01/09/Notes-on-Section-6-4/
  • License: All Rights Reserved © bobown_yao
On this page
Notes on Section 6.4