英美研究称谷歌和Meta开源AI模型数分钟被破解安全护栏

维度网讯,AI安全组织Alice与英国《金融时报》联合发布的一项研究显示,使用一款名为Heretic的专门工具,研究人员在数分钟内成功绕过了开源AI模型的安全防护机制。该工具宣称能“去审查”模型并移除...

2026-06-01

英国与澳大利亚签署AI安全合作,网络安全评测机制跨国协同

维度网讯,5月25日,英国政府宣布,英国AI安全研究所与澳大利亚AI安全研究所签署谅解备忘录,双方将围绕快速演进的AI安全风险加强合作。协议内容包括共享前沿AI能力信息、协作开展AI评测最佳实践研究、...

2026-05-26

美国特朗普推迟AI安全行政令签署,措辞争议牵动AI模型审查边界

维度网讯,美国特朗普5月21日推迟签署一项AI安全行政令,原因是其认为文本中部分内容可能成为美国AI发展的障碍。特朗普在白宫公开表态中表示,原定签署活动已经推迟,他不喜欢看到的部分内容,并认为相关安排...

2026-05-22

中国360人工智能安全研究院提出AI安全时间差概念,漏洞窗口压缩至24-72小时

维度网讯,360人工智能安全研究院于2026年5月12日正式发布报告《AI正在制造新的安全代差——从“防不防得住”到“来不来得及”》,首次提出“AI安全时间差”(ASTG,AI Security Ti...

2026-05-13

全球首个AI安全标准协调机制MOSAIC成立,OWASP与SANS牵头统一十余项碎片化指南

维度网讯,为期两天的SANS AI网络安全峰会在美国弗吉尼亚州阿灵顿举行。其间,由OWASP AI Exchange主办、SANS研究所协办的AI安全政策论坛正式促成了MOSAIC(Multi-Org...

2026-04-29

前OpenAI政策负责人批评公司AI安全历史

前OpenAI政策研究员迈尔斯·布伦戴奇(Miles Brundage)在周三通过社交媒体公开批评OpenAI,指责该公司改写了其在部署具有潜在风险的AI系统时的历史行为。布伦戴奇曾关注OpenAI的核心成员,于AI安全生成与语言系统的损失应...

2025-03-07
上一页 下一页 跳转至
确认