面试官问:大模型"幻觉"是什么?前端如何缓解?
📚 参考:模型幻觉 | RAG 检索增强生成
场景:面试官问"我们用 AI 做客服,它经常编造答案怎么办?前端能做哪些缓解?"
考察点:幻觉类型和根因、前端缓解手段、RAG 原理
详细信息
核心回答
模型幻觉(Hallucination)指模型生成的内容与事实不符,却表现出"一本正经胡说八道"。
text
幻觉类型:
├── 事实性幻觉:编造不存在的人物/事件/数据
│ 例:"李白写过一首《咏鹅》" ❌ — 这是骆宾王写的
├── 忠实性幻觉:偏离用户指令或上下文
│ 例:用户问"A方案",模型在回答里混入了 B 方案的细节
└── 逻辑性幻觉:推理链条断裂,前后矛盾1
2
3
4
5
6
2
3
4
5
6
幻觉的根因:
- 本质是 next token prediction,不存在"事实检查"机制
- 训练数据包含错误信息
- 解码时采样随机性(temperature 高时更容易胡说)
前端缓解手段:
text
┌─────────────────────────────────────────┐
│ 1. RAG(检索增强生成) │
│ 查询知识库 → 找到相关文档 → 塞进 prompt │
│ "根据以下资料回答问题:{检索到的文档}" │
│ 效果:把模型从"凭记忆回答"变成"开卷考试" │
├─────────────────────────────────────────┤
│ 2. 提示词约束 │
│ "如果不知道答案,直接说不知道,不要编造" │
│ "请引用原文来证明你的回答" │
├─────────────────────────────────────────┤
│ 3. 温度控制 │
│ temperature=0 时输出最确定(极少胡说) │
│ temperature=0.7~1.0 时更有创造性但更易编造│
├─────────────────────────────────────────┤
│ 4. 校验层 │
│ 输出后调置信度检测 API │
│ 或用更强的模型做事后审核 │
└─────────────────────────────────────────┘1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
面试回答要点
- 能用"开卷考试"比喻解释 RAG 为什么能减少幻觉
- 说出至少 2 种前端可操作的缓解手段
- 知道 temperature 越低越确定性
来源:模型幻觉概念讲解
