面试官问：监督学习、无监督学习、强化学习的区别？

📚 参考：机器学习 | 深度学习

考察点：三大机器学习范式的区分标准（数据是否有标签）、自监督学习与 LLM 训练的关系、RLHF 的本质理解

详细信息

核心回答

机器学习三大范式，按"数据是否有标签"区分：

text

监督学习：给学生「题目+答案」，考试考同类题
无监督学习：给学生「一堆题目」，自己找出题目的规律
强化学习：学生不知道答案，但做对了给糖，做错了惩罚，不断试错

关键延伸：

来源：机器学习概念讲解