同一天,Anthropic给AI加了一把锁,谷歌给AI换了一台发动机
一个选择加锁,一个选择换发动机。同一天,两家公司给出了 AI 的两种答案。回答的虽然是不同层次的问题,却指向了同一个方向。
Anthropic 于本周 6 月 9 日发布了 Claude Fable 5 和 Mythos 5,一模型两版本,用安全策略划分能力边界。次日,谷歌 DeepMind 发布 DiffusionGemma,26B MoE 开源模型,用文本扩散架构将本地推理速度拉升 4 倍。前后相差不到 24 小时,两家公司拿出了截然不同的 AI 产品哲学。
在 AI 行业从 " 谁更强 " 进入 " 谁能用得起、谁能安全地放出来 " 的新阶段,Anthropic 和谷歌的选择恰好构成了两种路线哲学的典型样本:一个在能力之上加安全锁,一个在效率上换新引擎。
它们不是对手,而是同一张拼图的两块。
一把锁与一台发动机
Anthropic 的选择是在能力之上加一把锁。
Fable 5 和 Mythos 5 共享同一底层模型,区别在于安全策略的松紧。Fable 5 内置风险分类器,高风险请求被降级到 Opus 4.8 处理;Mythos 5 移除所有限制,仅向 Project Glasswing 下经过审核的机构开放。这套 " 降维安全学 " 的本质是:模型能力已经强到需要分级管理,于是用软件层面的开关划分使用权限。
谷歌的选择则是换一台发动机。
DiffusionGemma 没有走主流大模型的自回归路线,那种逐 token 生成的 " 打字机 " 模式,而是将图像生成领域的扩散机制引入文本领域。它从一段随机噪声开始,一次性铺开 256 个 token 的 " 画布 ",通过多次并行迭代逐步去噪,最终生成连贯文本。好比从打字机换成了印刷机,不是逐字敲出,而是一次排版、整体输出。
效果是显著的,单块 H100 上每秒生成 1000+ tokens,消费级 RTX 5090 上 700+,比同等规模的自回归模型快约 4 倍。量化后仅占 18GB 显存,这意味着一张消费级显卡就能本地运行。
但 DiffusionGemma 有一个明确的前提:它是实验性模型。谷歌官方没有回避这一点,输出质量低于自回归路线的 Gemma 4。文本扩散架构在长文本连贯性和复杂推理任务上仍存在质量差距。这是用性能换速度的典型取舍:当生成速度提升 4 倍时,生成质量做出了让步。
这决定了 DiffusionGemma 的适用场景。它不是用来替代 Claude Fable 5 或 GPT-5.5 做复杂推理的,而是瞄准了低延迟、本地化、实时交互的应用场景——代码补全、实时翻译、本地 AI 助手、端侧推理。在这些场景中,速度的优先级高于单次输出的完美度。
Anthropic 的选择则相反。Fable 5 在 SWE-bench Pro 上得分 78.6%,FrontierCode Diamond 得分 29.3%,全面领先前代和竞品。Stripe 用它一天完成 5000 万行 Ruby 代码迁移,人工需要两个月。在 Anthropic 的价值排序中,能力上限是第一优先级,速度和安全都在其次。
两种路线没有对错之分,它们回答的是不同的问题,但共同揭示了 AI 行业正在发生的深层分野。
封闭与开源
Anthropic 的商业模式建立在稀缺性之上。
Fable 5 API 定价 60 美元 / 百万 token,是 Opus 4.8 的两倍、GPT-5.5 的 1.7 倍、DeepSeek-v4 的 46 倍。在全行业 AI 价格持续走低的背景下,Anthropic 逆势提价,赌的是绝对性能可以支撑溢价。Mythos 5 则更进一步,用安全审核制造准入壁垒,将高端能力变成稀缺资源。这套分层模式的核心逻辑是:能力越强,越要控制供给。
谷歌的路线完全相反。
DiffusionGemma 采用 Apache 2.0 许可证开源,权重开放下载,开发者可以在本地自由部署和修改。26B 参数、MoE 架构仅激活 3.8B、量化后 18GB 显存。这些技术指标的设计目标很明确:让尽可能多的人在自己的设备上跑起来。
谷歌还与英伟达合作,从发布首日起就支持 RTX 和 DGX 全系列 GPU。
这不是谷歌第一次走开源路线。从 Gemma 系列到 DiffusionGemma,谷歌在开源大模型领域的投入持续加码。但 DiffusionGemma 的特殊之处在于,它不是在已有路线上做开源版本,而是开辟了一条全新的技术路线——文本扩散。这意味着谷歌不仅在开源模型,还在开源一种新的架构范式。
尽管路径迥异,两个产品在几个维度上指向了相同的行业趋势。
一个最直观的趋同方向是本地化,DiffusionGemma 的目标场景就是本地推理,18GB 显存门槛意味着消费级硬件即可运行。Anthropic 虽然以云端 API 为主,但 Fable 5 的 " 自主反思和验证 " 能力,让模型自己检查自己工作,正是为了在无人值守的本地环境中实现自主任务。
两家公司从不同方向逼近同一个目标:让 AI 脱离云端依赖,在本地环境中独立运转。
另一个趋同方向在架构层面,DiffusionGemma 证明了非自回归路线的可行性,文本扩散架构用并行生成替代顺序生成,从根本上改变了效率曲线。
Anthropic 的 Fable 5 虽然仍基于自回归架构,但 " 一模型两版本 " 本身就是一种产品架构创新——不是用不同的模型满足不同需求,而是用同一个模型加不同的安全策略。当参数规模竞赛遇到边际收益递减,架构层面的创新正在成为新的竞争维度。
两条路线的交汇点
更深层的交汇在于护城河的迁移。
Anthropic 用安全分层构建合规壁垒,谷歌用效率提升降低使用门槛。两家公司都在寻找参数规模之外的新竞争维度。Anthropic 的安全体系越复杂,后来者越难复制;谷歌的 DiffusionGemma 速度越快,开发者越难拒绝。在 AI 能力逐渐趋同的未来,安全治理能力和效率优化能力可能比模型本身更能决定胜负。
一个容易被忽略的事实是,Anthropic 和谷歌的这两款产品,恰好填补了对方路线的空白。Anthropic 的 Fable 5/Mythos 5 走的是 " 能力最大化 + 安全管控 " 路线,但它缺乏一个轻量级、低成本、可本地部署的选项。对于不需要顶级推理能力、但需要低延迟本地响应的场景,Fable 5 的 API 定价和云端依赖构成了门槛。
谷歌的 DiffusionGemma 走的是 " 效率优先 + 开源普惠 " 路线,但它缺乏一个顶级推理能力的旗舰模型。对于需要复杂推理、长文分析、高精度代码生成的任务,DiffusionGemma 的实验性质量和非自回归架构的局限性使其难以胜任。
这两条路线不是竞争关系,而是互补关系。它们共同覆盖了 AI 应用光谱的两端:一端是云端高性能推理,一端是本地高效率生成。中间地带的融合,既能在本地运行、又具备顶级推理能力的模型,可能是下一阶段的竞争焦点。
从 Opus 4.8 到 Fable 5 仅 11 天,Anthropic 完成了代际跨越。从自回归到文本扩散,谷歌用 DiffusionGemma 开辟了一条全新的技术路线。两家公司在同一个时间窗口内,用截然不同的产品哲学,各自回答了一个核心问题:AI 能力持续增长之后,下一步往哪里走?
Anthropic 的答案是加一把锁,用安全分层管理能力,用稀缺性支撑商业价值。谷歌的答案是换一台发动机——用架构创新降低门槛,用开源生态扩大覆盖。一把锁,一台发动机,指向的是同一个判断:AI 行业的竞争维度正在从 " 谁更强 " 转向 " 谁能安全高效地让更多人用上 "。
这场博弈的终局,将由市场来裁决。但一个趋势已经清晰可见:AI 的下一轮竞争,拼的不再只是模型的大小,而是产品哲学的完整度和生态覆盖的广度。从今天起,这是一个需要重新评估的竞争格局。
(本文首发钛媒体 APP,作者 | 硅谷 Tech_news,编辑 | 焦燕)

