面试官问：大模型"幻觉"是什么？前端如何缓解？

📚 参考：模型幻觉 | RAG 检索增强生成

场景：面试官问"我们用 AI 做客服，它经常编造答案怎么办？前端能做哪些缓解？"

考察点：幻觉类型和根因、前端缓解手段、RAG 原理

详细信息

核心回答

模型幻觉（Hallucination）指模型生成的内容与事实不符，却表现出"一本正经胡说八道"。

text

幻觉类型：
├── 事实性幻觉：编造不存在的人物/事件/数据
│   例："李白写过一首《咏鹅》" ❌ — 这是骆宾王写的
├── 忠实性幻觉：偏离用户指令或上下文
│   例：用户问"A方案"，模型在回答里混入了 B 方案的细节
└── 逻辑性幻觉：推理链条断裂，前后矛盾

幻觉的根因：

本质是 next token prediction，不存在"事实检查"机制
训练数据包含错误信息
解码时采样随机性（temperature 高时更容易胡说）

前端缓解手段：

text

┌─────────────────────────────────────────┐
│ 1. RAG（检索增强生成）                    │
│    查询知识库 → 找到相关文档 → 塞进 prompt   │
│    "根据以下资料回答问题：{检索到的文档}"    │
│    效果：把模型从"凭记忆回答"变成"开卷考试" │
├─────────────────────────────────────────┤
│ 2. 提示词约束                            │
│    "如果不知道答案，直接说不知道，不要编造"  │
│    "请引用原文来证明你的回答"               │
├─────────────────────────────────────────┤
│ 3. 温度控制                              │
│    temperature=0 时输出最确定（极少胡说）    │
│    temperature=0.7~1.0 时更有创造性但更易编造│
├─────────────────────────────────────────┤
│ 4. 校验层                                │
│    输出后调置信度检测 API                   │
│    或用更强的模型做事后审核                 │
└─────────────────────────────────────────┘

面试回答要点

能用"开卷考试"比喻解释 RAG 为什么能减少幻觉
说出至少 2 种前端可操作的缓解手段
知道 temperature 越低越确定性

来源：模型幻觉概念讲解

面试官问：大模型"幻觉"是什么？前端如何缓解？ ​

核心回答 ​

面试回答要点 ​

面试官问：大模型"幻觉"是什么？前端如何缓解？

核心回答

面试回答要点