生成式 AI
概念
生成式 AI(Generative AI)是一类能够创造新内容的 AI 系统,包括文本、图像、音频、视频、代码等。与判别式 AI(只做分类和预测)不同,生成式 AI 学习的是数据的概率分布,从而能够生成与训练数据风格相似但又不完全相同的新内容。
核心公式可以理解为:给定训练数据分布 P(data),生成模型学习 P(new | context),在给定上下文后生成全新的内容。
判别式 AI vs 生成式 AI
| 维度 | 判别式 AI | 生成式 AI |
|---|---|---|
| 目标 | 学习决策边界 P(y | x) |
| 输出 | 分类标签、数值 | 文本、图片、音频等新内容 |
| 典型任务 | 图像分类、垃圾邮件检测 | 文本生成、图像生成、对话 |
| 举例 | ResNet、XGBoost | GPT-4、Stable Diffusion |
三大核心技术路线
自回归模型(Autoregressive Models)
逐个元素(token/pixel)地生成,每个新元素依赖之前已生成的内容。
- 代表:GPT 系列、Llama、Claude
- 应用:文本生成、代码补全
- 特点:生成质量高,但逐 token 生成速度较慢
扩散模型(Diffusion Models)
通过学习逆向去噪过程来生成数据。训练时逐步加噪破坏数据,推理时从纯噪声逐步去噪还原。
- 代表:Stable Diffusion、DALL·E、Midjourney
- 应用:图像生成、视频生成
- 特点:生成质量极高,但推理步骤多、速度慢
GAN(生成对抗网络)
由生成器和判别器两个网络相互博弈训练。
- 生成器:从随机噪声生成数据,试图"骗过"判别器
- 判别器:区分真实数据和生成数据
- 代表:StyleGAN、CycleGAN
- 特点:生成速度快,但训练不稳定
AIGC 应用场景
AIGC(AI Generated Content)正在重塑内容创作方式:
- 文本:ChatGPT 写作、翻译、摘要
- 代码:GitHub Copilot、Cursor 代码补全
- 图像:Midjourney 海报设计、Stable Diffusion 素材生成
- 音频:Suno AI 音乐生成、ElevenLabs 语音合成
- 视频:Sora、Runway 视频生成
面试常问
- 什么是 AIGC?它给前端开发带来了哪些变化?
- 生成式 AI 和以前的 AI 有什么本质不同?
- 前端如何集成生成式 AI 的能力?
