美国Anthropic Mythos模型发布一月后能力再进化，英国AI安全研究所测试显示超越GPT-5.5

2026-05-15 10:30

关键词:

维度网讯，英国AI安全研究所5月14日发布最新测试结果显示，Anthropic旗下前沿模型Claude Mythos Preview在获得更新版本检查点后，网络安全能力再度提升，首次成功完成两个完整网络攻击演练场。此前AISI评估中GPT-5.5在专家级任务上曾以71.4%的通过率略高于Mythos的68.6%，而此次更新后Mythos在32步模拟企业内网渗透任务中以10次尝试6次成功的成绩，大幅拉开了与GPT-5.5的差距。

Mythos于2026年4月7日由Anthropic正式宣布推出，被定位为超越Opus系列的全新层级模型，内部代号为“Capybara”，代表着Anthropic迄今构建的最强大AI系统。Anthropic决定不面向公众开放该模型，而是通过Project Glasswing计划向超过40家关键基础设施和网络安全合作伙伴提供受控访问，用于防御性漏洞发现与修复。Mythos Preview发布至今约一个月，AISI披露其获得了一个更新版本的模型检查点，该版本在网络安全任务中的表现比此前更强，甚至首次成功完成了之前所有模型均未通过的“Cooling Tower”工业控制系统攻击演练。

AISI的测试体系围绕“时间跨度基准”构建，通过估算人类网络安全专家完成特定任务所需时间来衡量AI模型的能力边界。在此框架下，Mythos在名为“The Last Ones”的32步模拟企业内网渗透任务中，10次尝试成功6次，完整覆盖从初始突破、横向移动到最终目标夺取的全链条攻击过程，AISI估算人类专家完成同等任务约需20小时。GPT-5.5在同一任务中10次尝试成功3次。更具标志性的是，Mythos首次突破了此前所有模型均未通过的“Cooling Tower”演练，该演练模拟对发电厂控制软件的攻击尝试，Mythos在10次尝试中成功3次。

AISI同时还公布了GPT-5.5的测试结果。GPT-5.5在AISI的专家级网络安全任务中平均通过率达71.4%，略高于Mythos此前版本的68.6%，两者在2.5M Token限制内处于相近水平。但在多步骤攻击模拟等更接近真实入侵场景的测试中，Mythos展现出了连贯完成长链路攻击的突出能力。AISI指出，GPT-5.5与Mythos在网络安全评估中达到相似表现水平，并认为Mythos的网络安全能力并非特定于单一模型的突破，而是长时程自主性、推理和编码能力整体提升的副产品。

AISI同步更新了前沿模型网络能力的翻倍周期估算。2025年11月，该机构估计模型可完成的网络安全任务时长每8个月翻一倍;2026年2月，基于2024年底推理模型出现后的进展，该周期被压缩至4.7个月。此次Mythos和GPT-5.5的实测表现已明显超出4.7个月的翻倍趋势线，AISI目前尚不确定这意味着更陡峭的新增长趋势已经出现，还是仅为一次短期跃升。

Anthropic负责前沿红队测试的Logan Graham确认，此次AISI测试使用的Mythos检查点正是与Project Glasswing同步上线的版本，外界看到的攻防能力并非实验室原型，而是正在运行的生产级模型。此前Mythos已在漏洞发现领域引发广泛关注，Mozilla借助其在Firefox中发现了271个安全漏洞并完成修复。Anthropic在系统卡中披露，Mythos Preview在测试中帮助识别了数千个高危零日漏洞，涵盖所有主流操作系统和浏览器。

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

英国