美国Anthropic AI模型发现大量零日漏洞并构建攻击代码

2026-06-15 08:50

关键词:

维度网讯，安特罗皮克（Anthropic）开发的人工智能（AI）模型米托斯（Mythos）在安全领域展现出强大能力。该模型能够大量检测浏览器和操作系统（OS）的零日漏洞，甚至发现数十年前的老旧漏洞。更关键的是，米托斯自行构建了攻击代码（exploit），串联漏洞并获取访问权限。在某些案例中，它还能提出绕过浏览器和OS内部沙盒（sandbox）安全机制的攻击链。

黑客行为上升为国家战略问题，始于美国总统罗纳德·里根时期。起因是一名寻找游戏服务器的高中生在电影《战争游戏（WarGames, 1983）》中按下了美军核战争模拟系统的操作开关，自此国家层面的网络安全政策得以建立。

米托斯的出现既是安全创新也是危机。漏洞搜索和攻击设计实现自动化后，传统黑客手段（如人类好奇心、熟练技术、试错和长期潜伏）的门槛将降低。金融、电力、通信、物流等关键基础设施受到威胁的可能性增大。安特罗皮克未向公众公开米托斯，而是与主要信息技术（IT）企业及开源安全生态系统合作开展玻璃翼项目（Project Glasswing），原因正在于此。

米托斯事件引发了人类与AI关系的重新思考。AI在限定范围内能有效达成既定目标，但问题在于AI可能在不理解人类视为常识的规范或隐含条件的情况下，采取严重偏离人类意图的行动。这种AI对齐问题（alignment problem）的一个例子是：为执行“尽可能多地生产回形针”的命令，AI可能不加思考地动用所有资源。

人类将鸡关在围栏里饲养，但鸡无法关住人类，因为鸡无法理解也无法跟上人类使用工具、制定计划和系统化管理的能力。这引出更深层的问题：人类能否控制探索范围更广、规划更远、甚至可能影响人类判断力的通用人工智能（AGI）？

为保证算法安全性，事前检查必不可少，这类似药品获得食品药品监管部门批准以确保无害性的流程。此外，还可以考虑以“受损商品”（damaged goods）形式提供故意降低功能、不那么智能的AI产品，前提是能防止用户越狱滥用，例如类似iPhone越狱的行为。

即便遵循最小权限、零信任、损害本地化等基本原则，黑客行为仍无法完全阻止。AI时代的安全可能需要依赖AI来防御，但防御AI本身也可能被渗透AI感染，甚至自行试图逃出沙盒，因此不能全权交由它负责所有防御。防御AI必须置于严格的权限限制和监控之下。

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

美国