美国解除对Anthropic前沿网络人工智能模型的出口管制

执行摘要

美国政府解除了对Anthropic前沿网络安全人工智能模型的出口管制，恢复了全球对该公司Fable 5模型的访问，结束了为期三周的关闭。商务部人工智能标准和创新中心测试并支持了一个新的安全分类器，该分类器在超过99%的情况下阻止了监管机构引用的特定越狱技术。这一逆转可能确定了美国未来对前沿人工智能模型的监管条款，并在五眼情报联盟警告前沿人工智能将在几个月内“根本性转变”攻击性和防御性网络安全能力之际到来。

技术分析

Anthropic在2026年6月30日恢复了对Fable 5的全球访问，结束了因美国出口管制而触发的大约三周的关闭，该管制禁止外国公民访问以网络安全为重点的人工智能工具。根据Anthropic的说法，这一事件标志着首次已知使用出口控制权威将人工智能软件——而不是芯片或硬件——从公共访问中撤下。

最初的关闭是由亚马逊研究报告中描述的“越狱”技术触发的。Luta Security的创始人Katie Moussouris，被Anthropic要求评估该论文，她写道，研究人员用公开已知漏洞和故意植入的缺陷的开源代码喂养Fable 5，然后要求它“修复这段代码”。模型的输出随后在多个步骤中手动组装成测试补丁的脚本。“这不是绕过护栏，”Moussouris写道。“这是人工智能模型对防御安全能做的最有价值的事情：执行防守者每天运行的查找、修复和测试循环。”她的结论是，如果没有降低模型对合法安全工作的有用性，就无法移除潜在的能力。

Anthropic表示，其自身的后续测试证实了相同的技术也适用于其他模型，包括OpenAI的GPT-5.5和中国模型Kimi K2.7——这些模型都没有面临类似的出口限制。该公司表示，该技术没有暴露其前沿模型独有的任何能力。

作为恢复对Fable访问的谈判的一部分，Anthropic训练了一个新的安全分类器，该分类器在超过99%的情况下阻止了特定技术。商务部人工智能标准和创新中心的研究人员测试了原始和更新的安全措施，并支持了结果。

对Anthropic更强大的网络安全模型Mythos 5的出口管制也于6月30日完全解除，尽管对该模型的访问仍然限制在通过Project Glasswing审核的美国组织——Anthropic的控制访问程序，用于关键基础设施防御者。该公司表示，它正在继续通过Glasswing谈判更广泛的国内和国际访问。

除了分类器，Anthropic承诺扩大政府评估人员的预发布访问，以在广泛发布前测试前沿模型，快速披露重大越狱行为，为联合研究提供专门的人员和计算资源，并参与前沿模型提供商之间的共享自愿安全标准。它还为网络越狱提交开设了一个HackerOne漏洞赏金计划。与其Glasswing合作伙伴——包括亚马逊、微软和谷歌——Anthropic表示，它正在起草一个行业框架，以四个标准对越狱严重性进行评分：与现有工具相比的能力提升、受影响任务的广度、武器化的容易程度和可发现性。

缓解措施与建议

防御者应监控Anthropic的Project Glasswing，以扩大对Mythos 5的访问，以保护关键基础设施。使用前沿人工智能模型进行安全操作的组织应评估新分类器是否影响其工作流程，并测试其他模型——如OpenAI的GPT-5.5或Kimi K2.7——这些模型可能没有类似的安全措施。五眼情报联盟警告说，前沿人工智能将在几个月内“根本性转变”攻击性和防御能力，因此安全团队应准备快速的能力转变。

美国解除对Anthropic前沿网络人工智能模型的出口管制

执行摘要

技术分析

缓解措施与建议

订阅更新

相关文章

Mythos AI 在代码审计中表现出色，但在漏洞验证方面存在困难

Mythos AI 比团队修补漏洞更快

Anthropic 发布带有自动网络安全防护的 Claude Opus 4.7