蚂蚁联合清华大学开源ClawAegis，为自主智能体打造原生安全免疫系统

2026-04-02 10:58

关键词:

维度网讯，4月1日，蚂蚁集团AI安全实验室与清华大学联手开源ClawAegis。据介绍，这是一套专为OpenClaw类自主智能体推出的“原生安全免疫系统”，它既能实时识别恶意指令注入和意图篡改，防止模型被“催眠”，也能在智能体准备执行敏感操作时动态介入，进行权限校验和行为审计，甚至针对死循环或资源滥用提供熔断机制，保障宿主机的稳定性。蚂蚁集团与清华大学联合开源的ClawAegis，标志着面向AI智能体的安全防护技术正从被动防御走向原生内嵌的安全架构。

从技术定位来看，ClawAegis专为OpenClaw类自主智能体设计。OpenClaw是指具备工具调用、跨应用操作与自主决策能力的智能体系统，这类智能体在执行用户指令时可能面临恶意指令注入、意图篡改等新型攻击手段。传统安全方案通常以外部监控为主，难以在智能体内部实现实时、细粒度的防护。ClawAegis以“原生安全免疫系统”为核心理念，将安全机制内嵌于智能体的运行链路之中，实现对恶意行为的实时感知与主动拦截。此次蚂蚁集团AI安全实验室与清华大学联手开源ClawAegis，将这一前沿防护能力开放给全球开发者，有助于提升自主智能体生态的整体安全水位。

ClawAegis的核心防护能力涵盖多个维度。在输入侧，它能够实时识别恶意指令注入和意图篡改，防止模型被“催眠”或诱导执行非预期操作。在执行侧，当智能体准备执行敏感操作时，ClawAegis会动态介入，进行权限校验和行为审计，确保每一次关键操作都符合预设的安全策略。此外，针对自主智能体可能出现的死循环或资源滥用问题，ClawAegis还提供了熔断机制，能够在异常情况下及时中止操作，保障宿主机的稳定性与资源安全。这些能力的组合，使ClawAegis能够覆盖智能体从指令接收、内部推理到外部执行的完整链路。

此次开源是蚂蚁集团与清华大学在AI安全领域的深度合作成果。蚂蚁集团AI安全实验室在业务安全、数据隐私与模型安全方面积累了大量实践经验，清华大学则在前沿安全研究与学术创新方面具备深厚底蕴。双方联合开源的ClawAegis，为行业提供了一套可落地、可扩展的自主智能体安全解决方案。随着AI智能体在办公、购物、开发等场景中的普及，类似ClawAegis的原生安全机制将成为保障智能体可靠运行的刚需组件。未来，ClawAegis有望通过社区贡献持续迭代，覆盖更多类型的自主智能体框架，推动AI安全从“事后补丁”向“内生免疫”的方向演进。

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告之，本站将予以修改或删除。邮箱：news@wedoany.com

中国