同一天，Anthropic给AI加了一把锁，谷歌给AI换了一台发动机

考研资深辅导 2026年06月14日 04:12:50

一个选择加锁，一个选择换发动机。同一天，两家公司给出了 AI 的两种答案。回答的虽然是不同层次的问题，却指向了同一个方向。

Anthropic 于本周 6 月 9 日发布了 Claude Fable 5 和 Mythos 5，一模型两版本，用安全策略划分能力边界。次日，谷歌 DeepMind 发布 DiffusionGemma，26B MoE 开源模型，用文本扩散架构将本地推理速度拉升 4 倍。前后相差不到 24 小时，两家公司拿出了截然不同的 AI 产品哲学。

在 AI 行业从 " 谁更强 " 进入 " 谁能用得起、谁能安全地放出来 " 的新阶段，Anthropic 和谷歌的选择恰好构成了两种路线哲学的典型样本：一个在能力之上加安全锁，一个在效率上换新引擎。

它们不是对手，而是同一张拼图的两块。

一把锁与一台发动机

Anthropic 的选择是在能力之上加一把锁。

Fable 5 和 Mythos 5 共享同一底层模型，区别在于安全策略的松紧。Fable 5 内置风险分类器，高风险请求被降级到 Opus 4.8 处理；Mythos 5 移除所有限制，仅向 Project Glasswing 下经过审核的机构开放。这套 " 降维安全学 " 的本质是：模型能力已经强到需要分级管理，于是用软件层面的开关划分使用权限。

谷歌的选择则是换一台发动机。

DiffusionGemma 没有走主流大模型的自回归路线，那种逐 token 生成的 " 打字机 " 模式，而是将图像生成领域的扩散机制引入文本领域。它从一段随机噪声开始，一次性铺开 256 个 token 的 " 画布 "，通过多次并行迭代逐步去噪，最终生成连贯文本。好比从打字机换成了印刷机，不是逐字敲出，而是一次排版、整体输出。

效果是显著的，单块 H100 上每秒生成 1000+ tokens，消费级 RTX 5090 上 700+，比同等规模的自回归模型快约 4 倍。量化后仅占 18GB 显存，这意味着一张消费级显卡就能本地运行。

但 DiffusionGemma 有一个明确的前提：它是实验性模型。谷歌官方没有回避这一点，输出质量低于自回归路线的 Gemma 4。文本扩散架构在长文本连贯性和复杂推理任务上仍存在质量差距。这是用性能换速度的典型取舍：当生成速度提升 4 倍时，生成质量做出了让步。

这决定了 DiffusionGemma 的适用场景。它不是用来替代 Claude Fable 5 或 GPT-5.5 做复杂推理的，而是瞄准了低延迟、本地化、实时交互的应用场景——代码补全、实时翻译、本地 AI 助手、端侧推理。在这些场景中，速度的优先级高于单次输出的完美度。

Anthropic 的选择则相反。Fable 5 在 SWE-bench Pro 上得分 78.6%，FrontierCode Diamond 得分 29.3%，全面领先前代和竞品。Stripe 用它一天完成 5000 万行 Ruby 代码迁移，人工需要两个月。在 Anthropic 的价值排序中，能力上限是第一优先级，速度和安全都在其次。

两种路线没有对错之分，它们回答的是不同的问题，但共同揭示了 AI 行业正在发生的深层分野。

封闭与开源

Anthropic 的商业模式建立在稀缺性之上。

Fable 5 API 定价 60 美元 / 百万 token，是 Opus 4.8 的两倍、GPT-5.5 的 1.7 倍、DeepSeek-v4 的 46 倍。在全行业 AI 价格持续走低的背景下，Anthropic 逆势提价，赌的是绝对性能可以支撑溢价。Mythos 5 则更进一步，用安全审核制造准入壁垒，将高端能力变成稀缺资源。这套分层模式的核心逻辑是：能力越强，越要控制供给。

谷歌的路线完全相反。

DiffusionGemma 采用 Apache 2.0 许可证开源，权重开放下载，开发者可以在本地自由部署和修改。26B 参数、MoE 架构仅激活 3.8B、量化后 18GB 显存。这些技术指标的设计目标很明确：让尽可能多的人在自己的设备上跑起来。

谷歌还与英伟达合作，从发布首日起就支持 RTX 和 DGX 全系列 GPU。

这不是谷歌第一次走开源路线。从 Gemma 系列到 DiffusionGemma，谷歌在开源大模型领域的投入持续加码。但 DiffusionGemma 的特殊之处在于，它不是在已有路线上做开源版本，而是开辟了一条全新的技术路线——文本扩散。这意味着谷歌不仅在开源模型，还在开源一种新的架构范式。

尽管路径迥异，两个产品在几个维度上指向了相同的行业趋势。

一个最直观的趋同方向是本地化，DiffusionGemma 的目标场景就是本地推理，18GB 显存门槛意味着消费级硬件即可运行。Anthropic 虽然以云端 API 为主，但 Fable 5 的 " 自主反思和验证 " 能力，让模型自己检查自己工作，正是为了在无人值守的本地环境中实现自主任务。

两家公司从不同方向逼近同一个目标：让 AI 脱离云端依赖，在本地环境中独立运转。

另一个趋同方向在架构层面，DiffusionGemma 证明了非自回归路线的可行性，文本扩散架构用并行生成替代顺序生成，从根本上改变了效率曲线。

Anthropic 的 Fable 5 虽然仍基于自回归架构，但 " 一模型两版本 " 本身就是一种产品架构创新——不是用不同的模型满足不同需求，而是用同一个模型加不同的安全策略。当参数规模竞赛遇到边际收益递减，架构层面的创新正在成为新的竞争维度。

两条路线的交汇点

更深层的交汇在于护城河的迁移。

Anthropic 用安全分层构建合规壁垒，谷歌用效率提升降低使用门槛。两家公司都在寻找参数规模之外的新竞争维度。Anthropic 的安全体系越复杂，后来者越难复制；谷歌的 DiffusionGemma 速度越快，开发者越难拒绝。在 AI 能力逐渐趋同的未来，安全治理能力和效率优化能力可能比模型本身更能决定胜负。

一个容易被忽略的事实是，Anthropic 和谷歌的这两款产品，恰好填补了对方路线的空白。Anthropic 的 Fable 5/Mythos 5 走的是 " 能力最大化 + 安全管控 " 路线，但它缺乏一个轻量级、低成本、可本地部署的选项。对于不需要顶级推理能力、但需要低延迟本地响应的场景，Fable 5 的 API 定价和云端依赖构成了门槛。

谷歌的 DiffusionGemma 走的是 " 效率优先 + 开源普惠 " 路线，但它缺乏一个顶级推理能力的旗舰模型。对于需要复杂推理、长文分析、高精度代码生成的任务，DiffusionGemma 的实验性质量和非自回归架构的局限性使其难以胜任。

这两条路线不是竞争关系，而是互补关系。它们共同覆盖了 AI 应用光谱的两端：一端是云端高性能推理，一端是本地高效率生成。中间地带的融合，既能在本地运行、又具备顶级推理能力的模型，可能是下一阶段的竞争焦点。

从 Opus 4.8 到 Fable 5 仅 11 天，Anthropic 完成了代际跨越。从自回归到文本扩散，谷歌用 DiffusionGemma 开辟了一条全新的技术路线。两家公司在同一个时间窗口内，用截然不同的产品哲学，各自回答了一个核心问题：AI 能力持续增长之后，下一步往哪里走？

Anthropic 的答案是加一把锁，用安全分层管理能力，用稀缺性支撑商业价值。谷歌的答案是换一台发动机——用架构创新降低门槛，用开源生态扩大覆盖。一把锁，一台发动机，指向的是同一个判断：AI 行业的竞争维度正在从 " 谁更强 " 转向 " 谁能安全高效地让更多人用上 "。

这场博弈的终局，将由市场来裁决。但一个趋势已经清晰可见：AI 的下一轮竞争，拼的不再只是模型的大小，而是产品哲学的完整度和生态覆盖的广度。从今天起，这是一个需要重新评估的竞争格局。

（本文首发钛媒体 APP，作者 | 硅谷 Tech_news，编辑 | 焦燕）

The End

相关文章