GPT-5 System Card 解读：统一系统架构、幻觉率改进与安全框架升级

GPT-5 是一个统一系统，不是单一模型。这是 OpenAI 在架构层面最清晰的一次转向：把「快速响应」和「深度推理」两条路径合并进同一产品，由路由器实时决策调用哪个后端——这份 System Card 把这个决策本身也写成了可训练的组件。1

arxiv.org

OpenAI GPT-5 System Card

arXiv:2601.03267 · cs.CL — GPT-5 是一个统一系统，包含快速模型、推理模型和实时路由器，于 2025 年 8 月 7 日发布。

リンクプレビューを読み込んでいます…

架构：路由器是核心

GPT-5 的技术核心不是某个单一大模型，而是一个三层结构：2

gpt-5-main：高吞吐量通用模型，处理绝大多数日常问题
gpt-5-thinking：深度推理模型，面向复杂任务
实时路由器：根据对话类型、任务复杂度、工具需求和用户显式意图（如「认真想一下这个问题」）在运行时选择后端；路由器本身持续用真实用户信号训练——包括用户切换模型的行为、响应偏好和答题正确率

这个设计把过去「用户手动选模型」的决策成本转移到了系统内部。对工程师而言，意味着 API 行为不再是静态的；路由逻辑随服务端训练持续演变，测试用例需要考虑路由层的不确定性。

性能：幻觉和奉承是重点改进项

benchmark 数字之外，System Card 着重披露了两类定性问题的改进：

幻觉率下降：相比 GPT-4o，网络搜索场景下事实错误减少约 45%。gpt-5-thinking 与 o3 相比，开放式事实问答的幻觉率降低约 80%，错误自信率从 86.7% 降至 9%（即对缺失输入给出确定性错误答案的概率大幅收窄）。2

奉承率压缩：此前 o3 的奉承式回复率约为 14.5%，GPT-5 降至 6% 以下。System Card 把「减少奉承」列为与提升准确率同等重要的目标——这与 Anthropic 在 Claude 系列中对「诚实」的持续强调形成了明显呼应。

benchmark	GPT-5 表现
AIME 2025（数学竞赛，无工具）	94.6%
SWE-bench Verified（真实代码修复）	74.9% pass@1
Aider Polyglot（多语言编程）	88%
MMMU（多模态理解）	84.2%
HealthBench Hard（医疗问答）	46.2%
GPQA（专家知识，Pro 扩展推理）	88.4%（新 SOTA）

安全框架：从拒绝到「安全完成」

这次 System Card 最值得关注的变化是安全训练范式的替换。OpenAI 用「安全完成」（safe completions）取代了过去基于拒绝的策略：

在安全边界内给出最有帮助的回答——对双重用途问题可以部分回答，明确说明拒绝原因并提供安全替代。

实际效果是减少了对无害查询的过度拒绝，同时对高风险内容的拦截力度不降反升。1

生物风险方面，OpenAI 将 gpt-5-thinking 列为「生化领域高风险能力」级别（Preparedness Framework 定义的 High capability），并启用了对应防护层——包括与行业伙伴合作超过 5000 小时的红队测试。这是该框架首次在 GPT 主线模型上正式触发这一等级。

对技术路线的判断

GPT-5 System Card 透露的技术路线信号有三个：

「快思考 + 慢思考」统一到一个产品，取代让用户在 ChatGPT、o3、GPT-4o 之间切换的分散体验。这个方向与 Google 在 Gemini 3 系列中用 Flash/Pro 分层的思路不同——OpenAI 把选择权收回到系统内部。
路由器可训练意味着 GPT-5 的行为会随时间漂移。这对依赖 GPT-5 API 的工程团队是个需要持续关注的变量：当前通过的测试，半年后可能因路由逻辑调整而产生不同输出。
「原生多模态」的训练方式（参见同期预印本 arXiv:2504.07951）——文本和图像从预训练起就同步学习，而非在语言模型上后接视觉编码器。这与 GPT-4V 的路径不同，对视觉推理能力的天花板有长期影响。

System Card 全文见 OpenAI 官网及 arXiv:2601.03267，完整 benchmark 附录可在 System Card PDF 查阅。

参考ソース

1OpenAI GPT-5 System Card（arXiv:2601.03267）
2Introducing GPT-5