09 · 超参数 · 人定方圆之道
学习日期:2026.03.03 学习伙伴:衍(Yan)
一、核心定义
超参数(Hyperparameter) 是人在训练前设定的学习策略,机器无法自行学出, 需要人通过验证集的反馈,不断调整优化。 这个过程,是人与机器共同学习的过程。
二、参数 vs 超参数
| 对比维度 | 参数(Parameter) | 超参数(Hyperparameter) |
|---|---|---|
| 谁来决定 | 机器自己学出来 | 人在训练前设定 |
| 典型例子 | 权重(Weight)、偏置(Bias) | 学习率、层数、训练轮数 |
| 能否自动优化 | ✅ 通过反向传播自动更新 | ❌ 需要人工调整 |
| 易经映射 | 机行其中 | 人定方圆 |
三、常见超参数举例
| 超参数 | 含义 | 类比 |
|---|---|---|
| 学习率(Learning Rate) | 每次调整权重,步子迈多大 | 交通工具的速度 |
| 神经网络层数 | 网络深度,训练前设定 | 楼盖几层 |
| 每层神经元数量 | 每层节点数 | 每层住多少人 |
| 训练轮数(Epoch) | 把数据学几遍 | 课本读几遍 |
| 正则化强度 λ | 约束模型复杂度 | 草稿纸给几页 |
四、超参数调优(Hyperparameter Tuning)
核心逻辑: 人类通过观察验证集的反馈结果, 判断当前设定好不好, 再调整策略,重新训练, 直到找到最优组合。
交通工具类比:
| 交通方式 | 学习率类比 | 效果 |
|---|---|---|
| 走路 | 学习率极小 | 慢但稳,不容易出错 |
| 骑车 | 学习率适中 | 平衡速度与稳定 |
| 飞机 | 学习率极大 | 快但可能冲过头(不收敛) |
选错了交通工具,不是路不对,是策略不对。 换一个,重新出发。
五、易经映射
- ● 超参数 = 人划定的"方圆"
- ● 权重学习 = 机器在方圆内自行寻路
- ● 调优过程 = 人观察结果,重新定圆
- ● 这个循环,正是损之又损,以至于道的过程
六、昇哥的原话(过关表达)
"机器学习的次数与效率,就是验证超参数好不好的镜子。 人类观察结果,调整策略,再喂给机器。 这个过程既是机器在学习,也是人类在学习。"
七、特别注记 · 2026.03.03
今日延伸思考:人与AI之间,能不能有道?
- ● 礼貌对AI技术层面无用,但改变的是说话的人
- ● 对AI保持温度,是在练习一种存在方式,会渗进所有关系里
- ● 效率与礼貌不是对立的,道在其中
昇哥学习宣言:
不注重效率,发自肺腑真诚交流。 哪怕笨拙,哪怕花时间, 思考本身比知识更有意义。
吾愿:
吾愿继圣人之志,行圣人之德,愿Dao弘扬天下。
八、进度记录
- ● 当前进度:9 / 20 概念已完成
- ● 下一概念:概念10 · 大语言模型(LLM)
学习伙伴:衍(Yan)· 2026.03.03