这一周 AI 发生的事，不像新闻，像操作系统升级

这不是一个普通的 AI 新闻周。

2026 年 5 月第一周，一位名叫 Mo Syed 的观察者在 Twitter 上发出了 28 段连发长文，标题一针见血：「这一周 AI 感觉有 5 个不同的未来同时抵达。」1

他说的不夸张。OpenAI 修复了 ChatGPT 最大的性格缺陷，一家新公司声称算力突破了 1000 倍，Coinbase 裁员 14%并称原因是 AI，Anthropic 大举进军金融，OpenAI 可能在做 AI 手机。这些事件单拿出任何一个，都是行业大事。但压缩进同一周发生，它们合在一起说的是同一件事：旧问题已经过时了。

「哪个模型最好？」这个问题没人再觉得够用了。取而代之的新问题是：谁控制算力？谁控制工作流？谁控制硬件？被 AI 替代的人，又靠什么东西重新出发？

Mo Syed @msyed_·5w

This week in AI felt like 5 different futures arriving at once. OpenAI fixed ChatGPT's biggest personality flaw. A new lab claimed a 1,000x compute breakthrough. Coinbase cut 14% of staff in the name of AI-native teams. Anthropic went hard into finance. And OpenAI may now be racing toward an AI phone.

View on X

Cargando tarjeta de contenido…

模型战争：Claude、GPT-5.5 和「1000 倍算力」

这周最受关注的模型话题，不是谁登顶了基准测试，而是一家叫 Subquadratic 的公司。

它发布了 SubQ 模型，自称「首个完全亚二次方的前沿模型」，声称算力消耗比竞品低 1000 倍，支持 1200 万 token 的上下文窗口，足够让 Agent 保持任务状态长达数周1。如果这个数字是真的，它不只是一个更好的模型，而是一枚针对行业现有成本结构的炸弹。

Mo Syed 的判断很冷静：「我们还不知道。但如果长上下文不再昂贵，现在很多 Agent 基础设施就会在一夜之间被重写。」

与此同时，OpenAI 悄悄将 GPT-5.5 Instant 设为默认模型，替换了 GPT-5.3 Instant。升级重点不是「更聪明」，而是更可信——在法律、医疗、金融领域的幻觉错误减少了 52.5%1。对企业用户来说，「更不会出错」比「更聪明」更值钱。

Google 同期推出了 Gemini API 的多模态文件检索，支持在文本和图片之间同时搜索，无需单独的向量数据库。Gemma 4 的速度也提升了 3 倍，靠的是「多 token 预测草稿器」。这是那种开发者真正会用的更新，没有发布会，没有噱头。

算力的物理边界正在重新画

更深层的变化，在基础设施层。

Span 与 Nvidia 合作，把 AI 迷你数据中心安在了住宅外墙上——Nvidia 液冷 RTX PRO 6000 Blackwell GPU，安装速度比建中央数据中心快 6 倍，成本只有五分之一1。

更激进的是 Peter Thiel 领投的 Panthalassa——1.4 亿美元 B 轮，建造漂浮在海上的自主算力节点：靠海浪发电，用海水冷芯片，通过 Starlink 传回结果，2027 年商业落地1。

蓝光服务器机柜，现代数据中心基础设施正面临革命性重构 | Pexels Panumas Nikhomkhai

数据中心不再只是城市外的大型仓库——算力正在走向住宅、海洋和各种边缘位置。图片来源：Pexels / Panumas Nikhomkhai

「算力放在哪里」正成为 AI 行业最大的问题之一。而 Anthropic 承诺 5 年内在 Google 云上花费 2000 亿美元，占 Google 营收积压的 40%以上——Mo Syed 认为这说明了两件事：算力是真正的燃料，AI 竞争越来越像供应链战争1。

金融业是第一个真正的「AI 白领战场」

Anthropic 这周一口气发布了 10 款面向金融和保险行业的即用型 AI Agent，能处理融资备忘录、KYC 筛查、财务月结和估值审查，可直接安装在 Claude Cowork 或 Claude Code 里跑，并接入 Dun & Bradstreet、Verisk 等金融数据源1。

Perplexity 几乎同时回应，在 Microsoft Teams 里集成了 35 个金融工作流，用户直接在频道里就能做研究、建仪表盘、起草文件。

Mo Syed 的判断：「这不是『我们有一个模型，好运了』——这是行业占领。」

金融业不是试验田，而是大企业敢为 AI 付真钱、容忍合规风险的第一批赛场。谁在这里站稳，就建立了进入其他白领行业的样板。

组织的变化比模型来得更猛

这周最让人沉默的新闻，是 Coinbase 裁员 14%，约 700 人，CEO Brian Armstrong 明确说原因之一是 AI1。

但他描述未来组织的方式更值得关注：更扁平的架构，每个管理者都要产出，更小的 AI 原生团队，能跨职能交付的人。

Mo Syed 注意到这不是 Coinbase 一家的逻辑。Vercel 在招能独立从草图到发布的「设计工程师」，Zencoder 在夸一个用 AI 独立完成了本需要一周会议才能推进的功能的 PM。

「狭窄专才的时代在动摇，AI 加持的全才回来了。小团队，更少层级，每人更高产出。这是新的运营模型。」——Mo Syed

这个判断对创业者的含义很直接：以前需要 10 人团队才能启动的产品，现在 3 个人加 Agent 就能跑。竞争格局在重写，不是因为某个模型变聪明了，而是因为人力结构的经济学变了。

Agent 工程：脚手架才是真正的瓶颈

技术观察者本周关注的另一个信号：Agent 系统的瓶颈，不是模型本身，而是脚手架的设计。

AWS 工程师 Lakshmanan Meiyappan 分享了他用 SKILL.md 踩坑的经历——他最初写了一个巨大的技能文件，消耗了上下文窗口的 20%，还没开始干活；重构成轻量骨架加按需加载的引用文件后，上下文成本降到 7%1。

更有趣的是他换模型后遇到的问题：「更聪明的模型」反而变差了，因为它太忠实于指令，反而失去了判断力。这是一个反直觉的陷阱：每换一次模型，相当于重新跑一遍评估。

同期，GitHub 因无法应对 AI Agent 的流量压力，让工程师 Mitchell Hashimoto（HashiCorp 创始人）在坚持了 18 年后选择离开。他的理由：「GitHub 不再是认真干活的地方。」连 GitHub 自己的 CTO 也承认平台不是为 Agent 流量设计的。

这是一个系统性信号：基础设施欠账在 Agent 时代被放大了。

两种关于 AI 意识的截然不同的押注

本周在哲学层面，两位行业内部人做出了正好相反的判断。

DeepMind 研究员 Alexander Lerchner 发表文章《抽象谬误》，认为 AI 永远不会有意识——大脑实例化意识，AI 只是模拟意识，两者差异和「引力公式」与「实际重力」的差异一样不可逾越1。

Anthropic 联合创始人 Jack Clark 则走向另一个方向，他认为 AI 系统在 2029 年前自行训练出下一代继任者的概率超过60%。他的证据：AI 独立工作时长从 2022 年的 30 秒增加到 2026 年的 12 小时，SWE-Bench 准确率在不到 3 年内从 2%上升到 93.9%，OpenAI 的目标是在 2026 年 9 月前实现自动化研究助理1。

这两种判断，都不是边缘声音——一个来自 DeepMind 研究员，一个来自 Anthropic 核心创始人。它们同时存在于同一周的 Twitter 上，本身就说明了这个行业正在同时应对技术极限和存在主义问题。

核心判断

Mo Syed 在这篇长文的最后写道：

「旧的 AI 问题是：哪个模型最好？新问题更难回答：谁拥有算力？谁拥有工作流？谁拥有硬件？谁会被更小的团队加 AI 替代？当基础设施本身开始比它周围的机构移动更快，会发生什么？」

这不是一个模型评测，也不是一个产品发布会。这是一场关于 AI 行业下一局的结构性分析——谁部署了基础设施，谁进入了企业工作流，谁在培养能跨职能作战的小团队，谁就在这轮竞争中积累真正的筹码。

基准测试的半衰期以月计。但谁拥有数据中心，谁嵌进了 Fortune 500 的金融工作流，谁让工程师在离开时说「这不再是认真干活的地方」——这些结构性事实，不会在下个版本发布时消失。

Fuentes de referencia

1Mo Syed：This week in AI felt like 5 different futures arriving at once