2024 年 AI 浪潮席卷整个行业,作为前端开发者,了解 AI / 大模型的基础概念及在前端的应用场景变得越来越重要。 本版块涵盖 30 个核心概念,涵盖基础认知、大模型原理、训练机制、推理生成和进阶实践。
目录
基础认知
- ✅ 什么是 AI — 人工智能定义、弱AI/强AI、三大流派、关键里程碑
- ✅ 机器学习 — 监督/无监督/强化学习、训练与推理
- ✅ 深度学习 — DNN/CNN/RNN、层级特征、架构对比
- ✅ 神经网络 — 神经元、激活函数、前向传播
- ✅ 生成式 AI — AIGC、扩散模型、自回归模型、GAN
大模型核心
- ✅ 大语言模型 LLM — GPT 演进、Scaling Law、涌现能力
- ✅ Transformer 架构 — Encoder/Decoder、Self-Attention、位置编码
- ✅ Token 与分词 — BPE/WordPiece、Token 计费与限制
- ✅ Embedding 向量嵌入 — 语义向量空间、余弦相似度、模型选型
- ✅ Attention 注意力机制 — Q/K/V、多头注意力、Flash Attention
训练机制
- ✅ 预训练与微调 — SFT、LoRA/QLoRA、参数高效微调
- ✅ 损失函数与梯度下降 — 交叉熵/MSE、SGD/Adam、学习率
- ✅ 反向传播 — 链式法则、计算图、梯度消失/爆炸
- ✅ 过拟合与正则化 — Dropout/L1/L2、早停、验证集
- ✅ RLHF 与对齐训练 — 三阶段对齐、PPO/DPO、HHH 原则
- ✅ 模型量化 — INT8/INT4、GGUF/GPTQ、浏览器推理
推理与生成
- ✅ 概率分布与 Softmax — Logits 转概率、Logprobs
- ✅ Temperature 与采样策略 — Top-p/Top-k、贪心 vs 随机
- ✅ 流式输出 Streaming — SSE/WebSocket、前端逐 token 消费
- ✅ 模型幻觉 — 成因、类型、RAG 缓解
- ✅ 上下文窗口 — Token 限制、Lost in the Middle、位置插值
进阶与实践
- ✅ Prompt Engineering — Zero-shot/Few-shot、CoT、System Prompt
- ✅ RAG 检索增强生成 — 分块/检索/重排/增强,前端 RAG 方案
- ✅ AI Agent 智能体 — ReAct、规划/工具/记忆、前端 Agent 场景
- ✅ Function Calling — Tool Use、JSON Schema、Structured Output
- ✅ 向量数据库 — ANN/HNSW、Milvus/Pinecone/pgvector
- ✅ MCP 协议 — Model Context Protocol、Client/Server、与 A2A 对比
- ✅ LangChain & AI SDK — 框架概述、Vercel AI SDK、选型建议
- ✅ Multi-Agent 系统 — 编排模式、通信机制、A2A 协议
- ✅ AI 安全与护栏 — 提示注入、Jailbreak、输入/输出层防护
