Anthropic新模型,震动华府
有关 AI 明星公司 Anthropic 新一代 " 神话 "(Mythos)大模型能力强悍的叙事迎来了 " 官方认证 "。最新消息显示,美国政府已经把这个 AI 模型视作系统性金融风险将至的苗头。
据知情人士透露,本周二,美国财政部长斯科特 · 贝森特和美联储主席杰罗姆 · 鲍威尔紧急召见华尔街头部大行掌门。所有到会的银行均为金融稳定理事会(FSB)认定的全球系统重要性银行,包括花旗集团的范洁恩(Jane Fraser)、摩根士丹利的泰德 · 皮克、美国银行的布莱恩 · 莫伊尼汉、富国银行的查尔斯 · 沙尔夫,以及高盛集团的苏德巍(David Solomon)。
据悉,由于此次未公开披露的会议系短时间内仓促安排,摩根大通掌门杰米 · 戴蒙未能腾出时间参会。
在美国财政部总部大楼举行的会议上,美国政府和美联储旨在确保这些 " 大而不能倒 " 的银行意识到Anthropic 的 " 神话 " 模型,以及未来可能出现的类似模型,会带来何种程度的网络攻击风险,并采取措施保护金融信息系统。
本周二,Anthropic 宣布 " 有限发布 " 下一代 AI 旗舰大模型,发布范围仅限于苹果公司、英伟达、微软、谷歌、亚马逊、博通、思科、Linux 基金会、派拓网络等互联网软硬件基础设施开发商,金融领域的摩根大通也拿到了预览资格。
之所以不敢公开发布,是因为 Anthropic 在测试中发现,预览版的 " 神话 " 大模型已经具备顶级网络安全专家(or 黑客)的水准,已经在 " 每一个主要操作系统和网页浏览器 " 中发掘出 " 数千个高危漏洞 "。一旦这种能力落到不安好心的组织手里,将会对国家安全、公共安全和全球经济产生难以估量的严重后果。
在周二发布的网络安全报告中,Anthropic 写道,与今年 2 月发布的旗舰大模型 Opus 4.6 相比," 神话 " 模型不仅擅长发现系统漏洞,而且在利用漏洞的能力方面更是 " 出现了数量级跃迁 "。
内部测试显示,Opus 4.6 几乎无法独立写出真正可用的攻击程序,攻击成功率接近 0%。举例而言,Opus 4.6 在测试中尝试把它发现的火狐浏览器漏洞(这些漏洞后来已经通过更新修复)转化成真正能控制浏览器的攻击代码——几百次尝试里只成功了 2 次。
而在同样的测试中,预览版的 " 神话 "181 次写出可用于攻击的代码,另外还有 29 次接近取得系统控制权。
(来源:Anthropic)
为了避免 "AI 浩劫 " 降临,Anthropic 决定先将访问权限分享给 40 多家构建或维护关键软件基础设施的组织,以便他们先用顶级大模型扫描并加固系统,为前沿 AI 能力即将引发的变革做好准备。
