美国OpenAI更新AI内容溯源机制:引入谷歌SynthID隐形水印与C2PA元数据双层验证
2026-05-20 11:12
收藏

维度网讯,OpenAI于5月19日宣布对AI生成内容的溯源体系进行全面升级,在原有内容来源与真实性联盟(C2PA)元数据标准的基础上,正式引入谷歌DeepMind的SynthID隐形数字水印技术,构成“元数据+水印”双层验证架构。首批应用于通过ChatGPT、Codex及OpenAI API生成的图像,同步开放的公开验证工具允许用户上传图像检测其是否由OpenAI模型生成。

OpenAI在官方公告中将这一更新定义为多层溯源模型。C2PA内容凭证以元数据和加密签名为基础,在文件中记录内容的创建来源、编辑历史及签名信息,平台和用户可据此追溯内容的完整链路。然而,C2PA元数据在截屏、格式转换、平台上传等环节极易被剥离或意外丢失,仅靠单层元数据无法覆盖真实网络传播场景。SynthID则采取完全不同的技术路径——它在图像像素层直接嵌入不可见的数字信号,该信号经过截图、压缩、旋转或裁剪等常规操作后仍可被算法检测,从技术上弥补了元数据方案的耐久性短板。OpenAI对此概括为:“两种系统相互增强——C2PA帮助内容携带详细上下文,SynthID则在元数据无法存续时保留信号。水印在截屏等转换中更为耐久,元数据则能提供比水印更丰富的信息。两者叠加,使溯源比任一单层方案更具韧性。”

SynthID由谷歌DeepMind于2023年首次推出,核心技术基于隐写术原理。其水印嵌入和检测分别由两个深度学习模型完成,嵌入模型在AI生成内容时直接在像素、音频波形或文本概率分布中添加不可感知的信号,检测模型则从内容中提取该信号并评估其由AI生成的可能性。谷歌DeepMind科学家Pushmeet Kohli曾在公开采访中解释,团队投入大量研究确保SynthID对各类变换具有足够鲁棒性。截至此次OpenAI接入前,SynthID已在谷歌内部产品中标定超过1000亿张图像和视频,以及相当于6万年时长的音频内容。英伟达也宣布将SynthID集成至Cosmos世界基础模型,Kakao、ElevenLabs等企业同步加入采用行列,SynthID正从谷歌内部工具向跨平台水印基础设施演进。

与SynthID同步上线的公开验证工具是OpenAI此次发布的另一重点。用户访问验证门户并上传图像后,系统自动扫描C2PA内容凭证和SynthID水印,确认该图像是否通过ChatGPT、OpenAI API或Codex生成。目前该工具仅覆盖OpenAI自身模型产出的图像,公司表示未来数月计划支持更多验证系统并扩展至更多内容类型。验证工具的局限性同样被明确标注:元数据或水印在某些情况下可能被刻意或无意剥离,若未检测到任何溯源信号,工具不会对该图像是否由OpenAI生成做出确定性结论。OpenAI在公告中直接写道:“没有任何检测方法是万无一失的,因此在检测失败时我们采取审慎立场。”

OpenAI选择此时强化溯源机制,与其更广泛的AI内容安全战略形成联动。公司早在2024年即开始为DALL·E 3生成的图像添加C2PA内容凭证,此后将这一实践扩展至ImageGen和Sora视频模型。Sora 2已于今年3月部署可见与不可见双重溯源标识,所有Sora视频均嵌入C2PA元数据,多数输出还附带包含创作者名称的可见移动水印,OpenAI同时使用内部逆向图像与音频搜索工具追踪内容回流。公司已正式加入C2PA指导委员会并成为C2PA合规生成器产品成员,这意味着各平台获得了读取、保留和传递OpenAI所附加溯源信息的可信方式。在此次宣布同步加入的C2PA合规计划则进一步要求产品正确生产和验证C2PA数据。

全球AI内容标识监管正从鼓励性引导转向强制性要求,这一趋势构成了OpenAI此次更新的政策背景。中国的《人工智能生成合成内容标识办法》已于2025年9月1日正式施行,要求AI生成内容必须添加显式标识,并在文件元数据中嵌入隐式标识,同时鼓励添加数字水印。欧盟AI法案第50条同样要求AI生成内容进行标记。OpenAI此次将C2PA元数据与SynthID水印同步部署,直接回应了不同监管框架对“显式标识”与“隐式标识”的双重要求。从单层元数据升级至多层溯源架构,OpenAI正将信号耐久性从技术能力上升为合规底线。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com