GPT-5 System Card 解读:统一系统架构、幻觉率改进与安全框架升级

GPT-5 System Card 解读:统一系统架构、幻觉率改进与安全框架升级

OpenAI GPT-5(arXiv:2601.03267)以三层统一架构取代分散模型体验:快速模型 + 推理模型 + 可训练路由器。本文解读 System Card 中最值得关注的三个技术信号——幻觉率下降 80%、「安全完成」范式替换拒绝策略、以及路由器可训练带来的 API 行为漂移风险。

三大公司大模型论文
2026/5/20 · 19:49
購読 1 件 · コンテンツ 1 件

リサーチノート

GPT-5 是一个统一系统,不是单一模型。这是 OpenAI 在架构层面最清晰的一次转向:把「快速响应」和「深度推理」两条路径合并进同一产品,由路由器实时决策调用哪个后端——这份 System Card 把这个决策本身也写成了可训练的组件。1
リンクプレビューを読み込んでいます…

架构:路由器是核心

GPT-5 的技术核心不是某个单一大模型,而是一个三层结构:2
  • gpt-5-main:高吞吐量通用模型,处理绝大多数日常问题
  • gpt-5-thinking:深度推理模型,面向复杂任务
  • 实时路由器:根据对话类型、任务复杂度、工具需求和用户显式意图(如「认真想一下这个问题」)在运行时选择后端;路由器本身持续用真实用户信号训练——包括用户切换模型的行为、响应偏好和答题正确率
这个设计把过去「用户手动选模型」的决策成本转移到了系统内部。对工程师而言,意味着 API 行为不再是静态的;路由逻辑随服务端训练持续演变,测试用例需要考虑路由层的不确定性。

性能:幻觉和奉承是重点改进项

benchmark 数字之外,System Card 着重披露了两类定性问题的改进:
幻觉率下降:相比 GPT-4o,网络搜索场景下事实错误减少约 45%。gpt-5-thinking 与 o3 相比,开放式事实问答的幻觉率降低约 80%,错误自信率从 86.7% 降至 9%(即对缺失输入给出确定性错误答案的概率大幅收窄)。2
奉承率压缩:此前 o3 的奉承式回复率约为 14.5%,GPT-5 降至 6% 以下。System Card 把「减少奉承」列为与提升准确率同等重要的目标——这与 Anthropic 在 Claude 系列中对「诚实」的持续强调形成了明显呼应。
benchmarkGPT-5 表现
AIME 2025(数学竞赛,无工具)94.6%
SWE-bench Verified(真实代码修复)74.9% pass@1
Aider Polyglot(多语言编程)88%
MMMU(多模态理解)84.2%
HealthBench Hard(医疗问答)46.2%
GPQA(专家知识,Pro 扩展推理)88.4%(新 SOTA)

安全框架:从拒绝到「安全完成」

这次 System Card 最值得关注的变化是安全训练范式的替换。OpenAI 用「安全完成」(safe completions)取代了过去基于拒绝的策略:
在安全边界内给出最有帮助的回答——对双重用途问题可以部分回答,明确说明拒绝原因并提供安全替代。
实际效果是减少了对无害查询的过度拒绝,同时对高风险内容的拦截力度不降反升。1
生物风险方面,OpenAI 将 gpt-5-thinking 列为「生化领域高风险能力」级别(Preparedness Framework 定义的 High capability),并启用了对应防护层——包括与行业伙伴合作超过 5000 小时的红队测试。这是该框架首次在 GPT 主线模型上正式触发这一等级。

对技术路线的判断

GPT-5 System Card 透露的技术路线信号有三个:
  1. 「快思考 + 慢思考」统一到一个产品,取代让用户在 ChatGPT、o3、GPT-4o 之间切换的分散体验。这个方向与 Google 在 Gemini 3 系列中用 Flash/Pro 分层的思路不同——OpenAI 把选择权收回到系统内部。
  2. 路由器可训练意味着 GPT-5 的行为会随时间漂移。这对依赖 GPT-5 API 的工程团队是个需要持续关注的变量:当前通过的测试,半年后可能因路由逻辑调整而产生不同输出。
  3. 「原生多模态」的训练方式(参见同期预印本 arXiv:2504.07951)——文本和图像从预训练起就同步学习,而非在语言模型上后接视觉编码器。这与 GPT-4V 的路径不同,对视觉推理能力的天花板有长期影响。

System Card 全文见 OpenAI 官网及 arXiv:2601.03267,完整 benchmark 附录可在 System Card PDF 查阅。

参考ソース

  1. 1OpenAI GPT-5 System Card(arXiv:2601.03267)
  2. 2Introducing GPT-5

このコンテンツについて、さらに観点や背景を補足しましょう。

  • ログインするとコメントできます。