维度网讯,美国白宫与人工智能公司Anthropic正在共同开发一套方法论,用于评估新型AI模型漏洞的严重性,并确定国家干预的时机。据Politico援引两位政府官员消息报道,围绕该公司最强大模型的封锁争议,正从私人冲突演变为制定通用规则的尝试。

导火索是一项出口管制措施。该措施迫使Anthropic因所谓的“越狱”(一种绕开模型保护的方法)而向所有用户关闭了Fable 5和Mythos 5。政府与Anthropic首席执行官达里奥·阿莫迪(Dario Amodei)对该漏洞的严重性评估出现分歧,结果发现国家缺乏解决此类争议的工具。技术发展已超越监管基础设施。
新框架旨在填补这一空白。双方正在制定一套统一的基准测试标准,用于评估未来的越狱行为:绕开保护的深度、暴露的模型能力以及入侵的实际后果。Anthropic方面的谈判由政府关系主管莎拉·赫克(Sarah Heck)和公司联合创始人汤姆·布朗(Tom Brown)负责。
该方法将Anthropic自身的原始论点纳入规则:完全免疫于入侵的模型不存在。同时,政府得到了一直缺失的要素:一套标准量表和干预的正式依据。本周在法国举行的七国集团会议上也传达了类似观点:主要AI公司高管和各国领导人一致认为,风险评估规则的制定应由国家承担。
出口限制目前仍未解除,但进展可见。上周五谈判实际上已破裂:Anthropic拒绝将Fable 5从公开平台下架,坚持漏洞范围有限,并非全面缺口。作为回应,白宫实施了出口管制。周末期间,双方进行了一系列长时间电话会议——参与者包括汤姆·布朗、商务部长霍华德·卢特尼克(Howard Lutnick)和网络总监肖恩·凯恩克罗斯(Sean Cairncross)——随后在华盛顿进行了近一周的面对面会谈。目前仍无恢复模型上架的时间表。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









