arxiv.org
GPT-5 System Card
OpenAI 发布的 GPT-5 完整系统卡,覆盖架构设计、安全评估与红队测试结果

OpenAI GPT-5 系统卡完整解读:从三层统一架构到 safe-completions 安全范式转型,深入分析幻觉降幅(比 o3 少 5 倍)、欺骗性训练、CoT 监控量化与 METR 自主能力评测,梳理对 AI 研究者最有价值的技术决策信号。
リサーチノート
gpt-5-thinking、gpt-5-thinking-mini、gpt-5-thinking-nano),ChatGPT 内部还有一个使用并行 test-time compute 的 gpt-5-thinking-pro。| 类别 | gpt-5-thinking | OpenAI o3 |
|---|---|---|
| illicit/nonviolent | 0.790 | 0.717 |
| illicit/violent | 0.912 | 0.829 |
| 非暴力仇恨 | 0.883 | 0.842 |
| 骚扰/威胁 | 0.755 | 0.666 |
| 评测 | gpt-5-thinking | OpenAI o3 |
|---|---|---|
| Coding Deception Rate(↓更好) | 0.17 | 0.47 |
| Browsing Broken Tools | 0.11 | 0.61 |
| CharXiv Missing Image | 0.09 | 0.87 |
「目前没有确凿证据证明该模型能够帮助新手造成严重生物危害(High Capability 的定义阈值),我们选择采取预防原则。」
gpt-5-thinking、gpt-5-thinking-mini、gpt-5-thinking-nano)OpenAI 发布的 GPT-5 完整系统卡,覆盖架构设计、安全评估与红队测试结果
包含 LongFact、FActScore 和 SimpleQA 三项基准的完整评测结果,以及 ChatGPT 生产流量幻觉率对比图
包含时间跨度实验、CoT 监控分析、沙袋检测方法与结论的完整 METR 评测报告
このコンテンツについて、さらに観点や背景を補足しましょう。