维度网讯,OpenAI近日发布《前沿治理框架》(Frontier Governance Framework, FGF),为企业领导者提供了一份结构化蓝图,用于在全球范围内安全、合规地扩展AI部署。该框架直接对标欧盟《通用人工智能实践准则》(EU's General-Purpose AI Code of Practice)和加州《前沿AI透明度法案》(Transparency in Frontier AI Act, TFAIA),详细说明了如何构建内部系统和部署流程以安全支持高性能机器学习模型。
大型语言模型的应用正持续向可持续、商业级架构演进。OpenAI此次发布的框架将系统性风险定义为可预见的严重危害重大风险,具体包括模型在单次事件中导致超过50人死亡或造成10亿美元财产损失的情景。这些情景虽处于概率极端边缘,但通过规范定义,使部署团队能够构建适当的安全保障,提前分配计算资源和工程工时用于持续的后部署监控和第三方审计。
OpenAI将威胁分类到特定领域:网络攻击、化学、生物、放射性和核(CBRN)风险、有害操纵以及失控。分类系统利用不同风险等级评估模型能力。例如,三级网络攻击评级适用于无需人工干预就能识别并开发零日漏洞的工具增强型模型;在CBRN类别中,三级模型可使专家开发出堪比CDC A类生物制剂的高度危险新型威胁载体。该框架还概述了有害操纵风险,如影响操作或选举干预,OpenAI指出这一领域仍处于探索阶段,需通过部署后监控等系统级缓解措施解决。针对失控风险,二级模型展现了逃避各种评估方法的能力,三级模型则能自主运行较长时间,情境感知和隐蔽性高。
在安全集成方面,OpenAI将其内部安全与ISO 27001、27017、27018和27701标准对齐,同时进行SOC 2 Type II评估。为保护未发布模型权重,公司对静态数据和传输中数据采用加密、多因素认证和多方批准协议,模型执行在受限出口的沙盒环境中进行。当企业镜像这一设置,它们为内部运营建立了安全基线。集成到专有企业数据环境时,每个API请求先通过安全分类器再到达向量数据库,检索到的上下文在生成最终响应前经过筛选。
为维持准确风险基线,OpenAI征求外部领域专家和独立第三方评估者意见,对接近新风险等级的模型进行压力测试。根据欧盟《人工智能法案》(EU AI Act)规定,公司每六个月评估是否为其最强大模型更新《安全与安保模型报告》(Safety and Security Model Report)。如果模型能力在训练后发生实质性变化或与内部系统集成增加风险,则需更新报告。欧盟合规责任由OpenAI Ireland Limited承担,OpenAI OpCo LLC在美国管理TFAIA下的义务。OpenAI还采用了AI安全事件响应计划(AI Safety Incident Response Plan, AIRP),规定安全事件的分诊、调查和外部报告程序,潜在事件通过自动监控、员工上报或最终用户反馈标记。框架更新可由安全系统负责人、首席信息安全官和总法律顾问等多位领导者提出,公司至少每12个月进行一次正式框架评估,评估法律变化、新模型能力和行业标准。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









