GPT-5 技术解读：混合路由架构下的推理、幻觉与安全新基线

GPT-5 是 OpenAI 在 2025 年 8 月发布的旗舰模型，但它在技术上更像一套混合路由系统，而非单一大模型。理解这个架构决策，比记住它的 benchmark 分数更重要。1

架构：路由系统而非单一模型

GPT-5 由三个核心组件构成：一个高速高吞吐量模型（gpt-5-main）、一个深度推理模型（gpt-5-thinking），以及一个实时路由器。路由器根据对话类型、任务复杂度、工具需求和用户明确意图，决定调用哪条路径——例如用户输入「仔细想想这个」，系统会切换到推理模式。

子模型	前代对应	定位
`gpt-5-main`	GPT-4o	高速通用，处理大多数日常查询
`gpt-5-main-mini`	GPT-4o-mini	轻量通用，限额用完时接管
`gpt-5-thinking`	OpenAI o3	深度推理，高难度问题
`gpt-5-thinking-mini`	OpenAI o4-mini	推理轻量版
`gpt-5-thinking-nano`	GPT-4.1-nano	API 专用，最小推理单元
`gpt-5-thinking-pro`	OpenAI o3 Pro	并行测试时计算，ChatGPT Pro 专属

路由器在真实生产流量上持续训练，信号来源包括用户主动切换模型的行为、响应偏好率和可测量的正确性。OpenAI 的计划是未来将所有能力整合为单个模型，当前的分离架构是工程过渡状态。2

关键数字

幻觉率和诚实性指标是 GPT-5 相较前代改进最明显的地方，也是 OpenAI 这次最着力强调的方向：

幻觉减少：开启联网时，GPT-5 的事实错误比 GPT-4o 少约 45%；推理模式下比 o3 少约 80%；在开放式事实查询（LongFact、FActScore）中，gpt-5-thinking 的幻觉数量约为 o3 的 1/6
欺骗性回复：生产流量中，推理模式下的欺骗率从 o3 的 4.8% 降至 2.1%
奉承性回复：针对性测试中，奉承率从 14.5% 降至 低于 6%

benchmark 数字方面：AIME 2025（无工具）94.6%，SWE-bench Verified 74.9%，MMMU（大学级视觉问题解决）84.2%，GPQA Diamond（GPT-5 Pro，无工具）88.4%。1

效率上有一个值得注意的数字：在多个领域，GPT-5（带推理）比 o3 少使用 50%–80% 的输出 token 达到同等效果——这对 API 调用成本有直接影响。

训练方式：原生多模态

GPT-5 和 GPT-4 的训练结构有实质区别。GPT-4 的视觉能力是在预训练好的语言模型基础上通过适配器加入的；GPT-5 从初始训练开始就同时在文本、图像等多种模态上训练，视觉和语言能力共同演化。2

OpenAI 将此称为「原生多模态」。它的实际效果体现在：GPT-5 可以推理图表、总结演示文稿照片、回答示意图相关问题，而不是通过单独的视觉模块路由再拼接答案。

训练流程分三个阶段：无监督预训练、监督微调、人类反馈强化学习。预训练数据集涵盖多语言书籍、文章、网页、学术论文和授权来源内容。

安全信号

GPT-5 系统卡的安全部分有几个值得工程师关注的判断：

OpenAI 将 gpt-5-thinking 列为**生物化学领域高能力（High capability）**模型，并激活了相应的防护措施——依据是其「预备框架（Preparedness Framework）」中的高能力门槛定义。公司明确表示没有确定性证据证明该模型能帮助新手造成严重生物危害，但选择了预防性处理。这是 OpenAI 框架内第二次激活高能力防护，第一次是 ChatGPT Agent。2

安全训练策略从「拒绝」转向「安全完成（safe-completions）」：对潜在有害查询，模型尝试给出安全的高阶回复，而非直接拒绝。目标是减少对无害信息查询的不必要拒绝，同时准确识别真正有风险的请求。

技术路线的含义

GPT-5 的架构给出了一个明确的技术信号：在单一模型扩展边际递减的背景下，OpenAI 选择用系统级路由而不是单纯堆参数来推进前沿性能。这与 Google 在 Gemini 2.5 中引入「混合推理」的思路，以及 Anthropic 在对齐研究（MSM）中的方向，共同指向 2025 年大模型研究的核心命题——推理质量、幻觉控制和对齐可靠性，正在取代参数规模成为新的竞争维度。

gpt-5-thinking-pro 支持并行测试时计算（parallel test time compute），意味着 OpenAI 仍在扩展推理算力的路径上投入，只是把扩展层移到了推理时而非训练时。这对需要高精度科学 / 数学 / 医学任务的工程师是最直接相关的信号。