面试官问：什么是大语言模型（LLM）？GPT 系列如何演进？

📚 参考：大语言模型 LLM | Transformer 架构

考察点：LLM 的核心能力来源（Scaling Law + 涌现能力）、GPT 系列各版本的关键突破、LLM 与本征 AGI 的区别

详细信息

核心回答

LLM（Large Language Model）是基于 Transformer 架构、拥有数十亿参数，通过海量文本训练的语言模型。核心能力来源于规模：

text

Scaling Law（规模定律）：模型参数量越大、训练数据越多、
计算量越大 → 模型能力越强，且可预测

关键发现：当参数量超过某个阈值后 → 涌现能力（Emergence）
—— 小模型没有、大模型突然出现的"开悟"能力
如：上下文学习、思维链推理、指令遵循

GPT 系列演进：

LLM ≠ AGI：LLM 本质是"next token prediction"，没有真正的理解和意识。但通过 Scaling + RLHF + 工具使用，表现越来越接近通用智能。

来源：大语言模型 LLM 概念讲解