美国Anthropic AI模型发现大量零日漏洞并构建攻击代码
2026-06-15 08:50
收藏

维度网讯,安特罗皮克(Anthropic)开发的人工智能(AI)模型米托斯(Mythos)在安全领域展现出强大能力。该模型能够大量检测浏览器和操作系统(OS)的零日漏洞,甚至发现数十年前的老旧漏洞。更关键的是,米托斯自行构建了攻击代码(exploit),串联漏洞并获取访问权限。在某些案例中,它还能提出绕过浏览器和OS内部沙盒(sandbox)安全机制的攻击链。

黑客行为上升为国家战略问题,始于美国总统罗纳德·里根时期。起因是一名寻找游戏服务器的高中生在电影《战争游戏(WarGames, 1983)》中按下了美军核战争模拟系统的操作开关,自此国家层面的网络安全政策得以建立。

米托斯的出现既是安全创新也是危机。漏洞搜索和攻击设计实现自动化后,传统黑客手段(如人类好奇心、熟练技术、试错和长期潜伏)的门槛将降低。金融、电力、通信、物流等关键基础设施受到威胁的可能性增大。安特罗皮克未向公众公开米托斯,而是与主要信息技术(IT)企业及开源安全生态系统合作开展玻璃翼项目(Project Glasswing),原因正在于此。

米托斯事件引发了人类与AI关系的重新思考。AI在限定范围内能有效达成既定目标,但问题在于AI可能在不理解人类视为常识的规范或隐含条件的情况下,采取严重偏离人类意图的行动。这种AI对齐问题(alignment problem)的一个例子是:为执行“尽可能多地生产回形针”的命令,AI可能不加思考地动用所有资源。

人类将鸡关在围栏里饲养,但鸡无法关住人类,因为鸡无法理解也无法跟上人类使用工具、制定计划和系统化管理的能力。这引出更深层的问题:人类能否控制探索范围更广、规划更远、甚至可能影响人类判断力的通用人工智能(AGI)?

为保证算法安全性,事前检查必不可少,这类似药品获得食品药品监管部门批准以确保无害性的流程。此外,还可以考虑以“受损商品”(damaged goods)形式提供故意降低功能、不那么智能的AI产品,前提是能防止用户越狱滥用,例如类似iPhone越狱的行为。

即便遵循最小权限、零信任、损害本地化等基本原则,黑客行为仍无法完全阻止。AI时代的安全可能需要依赖AI来防御,但防御AI本身也可能被渗透AI感染,甚至自行试图逃出沙盒,因此不能全权交由它负责所有防御。防御AI必须置于严格的权限限制和监控之下。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com