Notes on Section 4.5
权重衰减,也通常被称为L2正则化
在4.4中我们会发现参数过多,过于复杂的参数组会导致过拟合。所以这自然引出了我们要控制权重复杂度的想法,而首先我们就应该获得当前权重的复杂度。这里的方法就是通过函数与零的距离来衡量函数的复杂度

这里的操作方法也非常直观,就是在计算损失函数的时候为复杂权重增加一个“惩罚项”
这里有必要说明一下为什么使用L2正则化


可以看出,L2正则化本身更加的泛化
最终的梯度下降更新公式

实现方面只要在基础的线性层上更改就可以


- Title: Notes on Section 4.5
- Author: bobown_yao
- Created at : 2025-12-25 00:00:00
- Updated at : 2026-01-17 16:18:07
- Link: https://bobownyao.github.io/2025/12/25/Notes-on-Section-4-5/
- License: All Rights Reserved © bobown_yao