美国白宫与Anthropic合作制定AI安全评估标准

2026-06-19 11:41

关键词:

维度网讯，美国白宫与人工智能公司Anthropic正在共同开发一套方法论，用于评估新型AI模型漏洞的严重性，并确定国家干预的时机。据Politico援引两位政府官员消息报道，围绕该公司最强大模型的封锁争议，正从私人冲突演变为制定通用规则的尝试。

导火索是一项出口管制措施。该措施迫使Anthropic因所谓的“越狱”（一种绕开模型保护的方法）而向所有用户关闭了Fable 5和Mythos 5。政府与Anthropic首席执行官达里奥·阿莫迪（Dario Amodei）对该漏洞的严重性评估出现分歧，结果发现国家缺乏解决此类争议的工具。技术发展已超越监管基础设施。

新框架旨在填补这一空白。双方正在制定一套统一的基准测试标准，用于评估未来的越狱行为：绕开保护的深度、暴露的模型能力以及入侵的实际后果。Anthropic方面的谈判由政府关系主管莎拉·赫克（Sarah Heck）和公司联合创始人汤姆·布朗（Tom Brown）负责。

该方法将Anthropic自身的原始论点纳入规则：完全免疫于入侵的模型不存在。同时，政府得到了一直缺失的要素：一套标准量表和干预的正式依据。本周在法国举行的七国集团会议上也传达了类似观点：主要AI公司高管和各国领导人一致认为，风险评估规则的制定应由国家承担。

出口限制目前仍未解除，但进展可见。上周五谈判实际上已破裂：Anthropic拒绝将Fable 5从公开平台下架，坚持漏洞范围有限，并非全面缺口。作为回应，白宫实施了出口管制。周末期间，双方进行了一系列长时间电话会议——参与者包括汤姆·布朗、商务部长霍华德·卢特尼克（Howard Lutnick）和网络总监肖恩·凯恩克罗斯（Sean Cairncross）——随后在华盛顿进行了近一周的面对面会谈。目前仍无恢复模型上架的时间表。

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

美国