美国Anthropic Mythos模型发布一月后能力再进化,英国AI安全研究所测试显示超越GPT-5.5
2026-05-15 10:30
收藏

维度网讯,英国AI安全研究所5月14日发布最新测试结果显示,Anthropic旗下前沿模型Claude Mythos Preview在获得更新版本检查点后,网络安全能力再度提升,首次成功完成两个完整网络攻击演练场。此前AISI评估中GPT-5.5在专家级任务上曾以71.4%的通过率略高于Mythos的68.6%,而此次更新后Mythos在32步模拟企业内网渗透任务中以10次尝试6次成功的成绩,大幅拉开了与GPT-5.5的差距。

Mythos于2026年4月7日由Anthropic正式宣布推出,被定位为超越Opus系列的全新层级模型,内部代号为“Capybara”,代表着Anthropic迄今构建的最强大AI系统。Anthropic决定不面向公众开放该模型,而是通过Project Glasswing计划向超过40家关键基础设施和网络安全合作伙伴提供受控访问,用于防御性漏洞发现与修复。Mythos Preview发布至今约一个月,AISI披露其获得了一个更新版本的模型检查点,该版本在网络安全任务中的表现比此前更强,甚至首次成功完成了之前所有模型均未通过的“Cooling Tower”工业控制系统攻击演练。

AISI的测试体系围绕“时间跨度基准”构建,通过估算人类网络安全专家完成特定任务所需时间来衡量AI模型的能力边界。在此框架下,Mythos在名为“The Last Ones”的32步模拟企业内网渗透任务中,10次尝试成功6次,完整覆盖从初始突破、横向移动到最终目标夺取的全链条攻击过程,AISI估算人类专家完成同等任务约需20小时。GPT-5.5在同一任务中10次尝试成功3次。更具标志性的是,Mythos首次突破了此前所有模型均未通过的“Cooling Tower”演练,该演练模拟对发电厂控制软件的攻击尝试,Mythos在10次尝试中成功3次。

AISI同时还公布了GPT-5.5的测试结果。GPT-5.5在AISI的专家级网络安全任务中平均通过率达71.4%,略高于Mythos此前版本的68.6%,两者在2.5M Token限制内处于相近水平。但在多步骤攻击模拟等更接近真实入侵场景的测试中,Mythos展现出了连贯完成长链路攻击的突出能力。AISI指出,GPT-5.5与Mythos在网络安全评估中达到相似表现水平,并认为Mythos的网络安全能力并非特定于单一模型的突破,而是长时程自主性、推理和编码能力整体提升的副产品。

AISI同步更新了前沿模型网络能力的翻倍周期估算。2025年11月,该机构估计模型可完成的网络安全任务时长每8个月翻一倍;2026年2月,基于2024年底推理模型出现后的进展,该周期被压缩至4.7个月。此次Mythos和GPT-5.5的实测表现已明显超出4.7个月的翻倍趋势线,AISI目前尚不确定这意味着更陡峭的新增长趋势已经出现,还是仅为一次短期跃升。

Anthropic负责前沿红队测试的Logan Graham确认,此次AISI测试使用的Mythos检查点正是与Project Glasswing同步上线的版本,外界看到的攻防能力并非实验室原型,而是正在运行的生产级模型。此前Mythos已在漏洞发现领域引发广泛关注,Mozilla借助其在Firefox中发现了271个安全漏洞并完成修复。Anthropic在系统卡中披露,Mythos Preview在测试中帮助识别了数千个高危零日漏洞,涵盖所有主流操作系统和浏览器。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com