维度网讯,4月1日,蚂蚁集团AI安全实验室与清华大学联手开源ClawAegis。据介绍,这是一套专为OpenClaw类自主智能体推出的“原生安全免疫系统”,它既能实时识别恶意指令注入和意图篡改,防止模型被“催眠”,也能在智能体准备执行敏感操作时动态介入,进行权限校验和行为审计,甚至针对死循环或资源滥用提供熔断机制,保障宿主机的稳定性。蚂蚁集团与清华大学联合开源的ClawAegis,标志着面向AI智能体的安全防护技术正从被动防御走向原生内嵌的安全架构。
从技术定位来看,ClawAegis专为OpenClaw类自主智能体设计。OpenClaw是指具备工具调用、跨应用操作与自主决策能力的智能体系统,这类智能体在执行用户指令时可能面临恶意指令注入、意图篡改等新型攻击手段。传统安全方案通常以外部监控为主,难以在智能体内部实现实时、细粒度的防护。ClawAegis以“原生安全免疫系统”为核心理念,将安全机制内嵌于智能体的运行链路之中,实现对恶意行为的实时感知与主动拦截。此次蚂蚁集团AI安全实验室与清华大学联手开源ClawAegis,将这一前沿防护能力开放给全球开发者,有助于提升自主智能体生态的整体安全水位。
ClawAegis的核心防护能力涵盖多个维度。在输入侧,它能够实时识别恶意指令注入和意图篡改,防止模型被“催眠”或诱导执行非预期操作。在执行侧,当智能体准备执行敏感操作时,ClawAegis会动态介入,进行权限校验和行为审计,确保每一次关键操作都符合预设的安全策略。此外,针对自主智能体可能出现的死循环或资源滥用问题,ClawAegis还提供了熔断机制,能够在异常情况下及时中止操作,保障宿主机的稳定性与资源安全。这些能力的组合,使ClawAegis能够覆盖智能体从指令接收、内部推理到外部执行的完整链路。
此次开源是蚂蚁集团与清华大学在AI安全领域的深度合作成果。蚂蚁集团AI安全实验室在业务安全、数据隐私与模型安全方面积累了大量实践经验,清华大学则在前沿安全研究与学术创新方面具备深厚底蕴。双方联合开源的ClawAegis,为行业提供了一套可落地、可扩展的自主智能体安全解决方案。随着AI智能体在办公、购物、开发等场景中的普及,类似ClawAegis的原生安全机制将成为保障智能体可靠运行的刚需组件。未来,ClawAegis有望通过社区贡献持续迭代,覆盖更多类型的自主智能体框架,推动AI安全从“事后补丁”向“内生免疫”的方向演进。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告之,本站将予以修改或删除。邮箱:news@wedoany.com









