Anthropic的安全警告可能适得其反——美国政府已叫停其最强AI模型
美国政府于上周五下令Anthropic立即关闭其两款最强AI模型——Claude Fable 5和Claude Mythos 5,理由是国家安全担忧。Anthropic在X平台上表示已遵从指令,但明确认为政府判断有误。该指令迫使公司面向全球用户禁用这两款模型,而不仅仅是名义上针对外国国民的出口管制。其他模型不受影响。
背景:Mythos的强大能力
Mythos是Anthropic迄今为止最强大的AI模型,于4月初预览后一直严格受限,因其在软件安全漏洞发现方面表现卓越。据Anthropic称,Mythos在测试中发现了所有主流操作系统和浏览器的漏洞,因此公司未广泛发布,而是通过名为Project Glasswing的控制计划,与约50家经过审查的组织(包括亚马逊、苹果、谷歌、微软和CrowdStrike)共享,用于防御性网络安全工作。
Fable 5:商业压力下的折中
Fable 5仅于三天前发布,是Anthropic应对商业压力的产物:在Mythos基础上增加护栏,阻止在高风险领域(如网络安全和生物学)的响应,公司认为其安全性足以公开发布。根据跟踪AI技术性能的Vals AI基准测试,它立即成为公众可用的最强AI模型。
政府的担忧与Anthropic的反驳
政府的指令以出口管制行动为框架,限制外国国民访问模型。但Anthropic在长篇博文中表示,其理解是根本担忧是所谓的Fable 5遭“越狱”。公司称,政府仅提供了口头证据,表明存在一种狭窄、非普遍性的越狱——即提示模型读取特定代码库并识别软件漏洞。Anthropic指出,这种能力已广泛存在于其他公开模型中,包括OpenAI的GPT-5.5,且被网络安全专业人员常规用于防御目的。
Anthropic的核心论点是,其最强防护措施通过独立的分类器系统运行,而政府担忧的所谓越狱并不构成真正威胁。公司表示:“我们不同意狭窄越狱的发现应成为召回已部署给数亿用户的商业模型的原因。”
影响与行业启示
这一事件凸显了AI安全与国家安全之间的紧张关系。Anthropic原本希望通过主动限制最强模型来避免监管风险,但政府的介入反而证明了其努力可能适得其反。对于整个AI行业而言,这预示着未来模型发布可能面临更严格的审查,尤其是在涉及网络安全等敏感领域时。


