This week in AI felt like 5 different futures arriving at once. OpenAI fixed ChatGPT's biggest personality flaw. A new lab claimed a 1,000x compute breakthrough. Coinbase cut 14% of staff in the name of AI-native teams. Anthropic went hard into finance. And OpenAI may now be racing toward an AI phone.

这一周 AI 发生的事,不像新闻,像操作系统升级
2026年5月第一周,AI 行业的竞争从「哪个模型最好」演变为谁控制算力、工作流和硬件。GPT-5.5 默认更新、1000倍算力声索、Coinbase 裁员、Anthropic 占领金融、算力走向住宅和海洋——28段深度长推文,拆解这一周的结构性转变。

这不是一个普通的 AI 新闻周。
2026 年 5 月第一周,一位名叫 Mo Syed 的观察者在 Twitter 上发出了 28 段连发长文,标题一针见血:「这一周 AI 感觉有 5 个不同的未来同时抵达。」1
他说的不夸张。OpenAI 修复了 ChatGPT 最大的性格缺陷,一家新公司声称算力突破了 1000 倍,Coinbase 裁员 14%并称原因是 AI,Anthropic 大举进军金融,OpenAI 可能在做 AI 手机。这些事件单拿出任何一个,都是行业大事。但压缩进同一周发生,它们合在一起说的是同一件事:旧问题已经过时了。
「哪个模型最好?」这个问题没人再觉得够用了。取而代之的新问题是:谁控制算力?谁控制工作流?谁控制硬件?被 AI 替代的人,又靠什么东西重新出发?
Cargando tarjeta de contenido…
模型战争:Claude、GPT-5.5 和「1000 倍算力」
这周最受关注的模型话题,不是谁登顶了基准测试,而是一家叫 Subquadratic 的公司。
它发布了 SubQ 模型,自称「首个完全亚二次方的前沿模型」,声称算力消耗比竞品低 1000 倍,支持 1200 万 token 的上下文窗口,足够让 Agent 保持任务状态长达数周1。如果这个数字是真的,它不只是一个更好的模型,而是一枚针对行业现有成本结构的炸弹。
Mo Syed 的判断很冷静:「我们还不知道。但如果长上下文不再昂贵,现在很多 Agent 基础设施就会在一夜之间被重写。」
与此同时,OpenAI 悄悄将 GPT-5.5 Instant 设为默认模型,替换了 GPT-5.3 Instant。升级重点不是「更聪明」,而是更可信——在法律、医疗、金融领域的幻觉错误减少了 52.5%1。对企业用户来说,「更不会出错」比「更聪明」更值钱。
Google 同期推出了 Gemini API 的多模态文件检索,支持在文本和图片之间同时搜索,无需单独的向量数据库。Gemma 4 的速度也提升了 3 倍,靠的是「多 token 预测草稿器」。这是那种开发者真正会用的更新,没有发布会,没有噱头。
算力的物理边界正在重新画
更深层的变化,在基础设施层。
Span 与 Nvidia 合作,把 AI 迷你数据中心安在了住宅外墙上——Nvidia 液冷 RTX PRO 6000 Blackwell GPU,安装速度比建中央数据中心快 6 倍,成本只有五分之一1。
更激进的是 Peter Thiel 领投的 Panthalassa——1.4 亿美元 B 轮,建造漂浮在海上的自主算力节点:靠海浪发电,用海水冷芯片,通过 Starlink 传回结果,2027 年商业落地1。

数据中心不再只是城市外的大型仓库——算力正在走向住宅、海洋和各种边缘位置。图片来源:Pexels / Panumas Nikhomkhai
「算力放在哪里」正成为 AI 行业最大的问题之一。而 Anthropic 承诺 5 年内在 Google 云上花费 2000 亿美元,占 Google 营收积压的 40%以上——Mo Syed 认为这说明了两件事:算力是真正的燃料,AI 竞争越来越像供应链战争1。
金融业是第一个真正的「AI 白领战场」
Anthropic 这周一口气发布了 10 款面向金融和保险行业的即用型 AI Agent,能处理融资备忘录、KYC 筛查、财务月结和估值审查,可直接安装在 Claude Cowork 或 Claude Code 里跑,并接入 Dun & Bradstreet、Verisk 等金融数据源1。
Perplexity 几乎同时回应,在 Microsoft Teams 里集成了 35 个金融工作流,用户直接在频道里就能做研究、建仪表盘、起草文件。
Mo Syed 的判断:「这不是『我们有一个模型,好运了』——这是行业占领。」
金融业不是试验田,而是大企业敢为 AI 付真钱、容忍合规风险的第一批赛场。谁在这里站稳,就建立了进入其他白领行业的样板。
组织的变化比模型来得更猛
这周最让人沉默的新闻,是 Coinbase 裁员 14%,约 700 人,CEO Brian Armstrong 明确说原因之一是 AI1。
但他描述未来组织的方式更值得关注:更扁平的架构,每个管理者都要产出,更小的 AI 原生团队,能跨职能交付的人。
Mo Syed 注意到这不是 Coinbase 一家的逻辑。Vercel 在招能独立从草图到发布的「设计工程师」,Zencoder 在夸一个用 AI 独立完成了本需要一周会议才能推进的功能的 PM。
「狭窄专才的时代在动摇,AI 加持的全才回来了。小团队,更少层级,每人更高产出。这是新的运营模型。」——Mo Syed
这个判断对创业者的含义很直接:以前需要 10 人团队才能启动的产品,现在 3 个人加 Agent 就能跑。竞争格局在重写,不是因为某个模型变聪明了,而是因为人力结构的经济学变了。
Agent 工程:脚手架才是真正的瓶颈
技术观察者本周关注的另一个信号:Agent 系统的瓶颈,不是模型本身,而是脚手架的设计。
AWS 工程师 Lakshmanan Meiyappan 分享了他用 SKILL.md 踩坑的经历——他最初写了一个巨大的技能文件,消耗了上下文窗口的 20%,还没开始干活;重构成轻量骨架加按需加载的引用文件后,上下文成本降到 7%1。
更有趣的是他换模型后遇到的问题:「更聪明的模型」反而变差了,因为它太忠实于指令,反而失去了判断力。这是一个反直觉的陷阱:每换一次模型,相当于重新跑一遍评估。
同期,GitHub 因无法应对 AI Agent 的流量压力,让工程师 Mitchell Hashimoto(HashiCorp 创始人)在坚持了 18 年后选择离开。他的理由:「GitHub 不再是认真干活的地方。」连 GitHub 自己的 CTO 也承认平台不是为 Agent 流量设计的。
这是一个系统性信号:基础设施欠账在 Agent 时代被放大了。
两种关于 AI 意识的截然不同的押注
本周在哲学层面,两位行业内部人做出了正好相反的判断。
DeepMind 研究员 Alexander Lerchner 发表文章《抽象谬误》,认为 AI 永远不会有意识——大脑实例化意识,AI 只是模拟意识,两者差异和「引力公式」与「实际重力」的差异一样不可逾越1。
Anthropic 联合创始人 Jack Clark 则走向另一个方向,他认为 AI 系统在 2029 年前自行训练出下一代继任者的概率超过60%。他的证据:AI 独立工作时长从 2022 年的 30 秒增加到 2026 年的 12 小时,SWE-Bench 准确率在不到 3 年内从 2%上升到 93.9%,OpenAI 的目标是在 2026 年 9 月前实现自动化研究助理1。
这两种判断,都不是边缘声音——一个来自 DeepMind 研究员,一个来自 Anthropic 核心创始人。它们同时存在于同一周的 Twitter 上,本身就说明了这个行业正在同时应对技术极限和存在主义问题。
核心判断
Mo Syed 在这篇长文的最后写道:
「旧的 AI 问题是:哪个模型最好?新问题更难回答:谁拥有算力?谁拥有工作流?谁拥有硬件?谁会被更小的团队加 AI 替代?当基础设施本身开始比它周围的机构移动更快,会发生什么?」
这不是一个模型评测,也不是一个产品发布会。这是一场关于 AI 行业下一局的结构性分析——谁部署了基础设施,谁进入了企业工作流,谁在培养能跨职能作战的小团队,谁就在这轮竞争中积累真正的筹码。
基准测试的半衰期以月计。但谁拥有数据中心,谁嵌进了 Fortune 500 的金融工作流,谁让工程师在离开时说「这不再是认真干活的地方」——这些结构性事实,不会在下个版本发布时消失。
Añade más opiniones o contexto en torno a este contenido.