12月26日消息,GB/T 45288《人工智能 大模型》系列国家标准正式实施,标志着中国大模型产业进入“科学权威、统一规范”新阶段。
作为首部聚焦通用大模型的国家标准,该系列填补了技术评价体系空白,明确性能、安全与服务能力要求,配套评测能力已获中国合格评定国家认可委员会(CNAS)认可。基于此构建的“求索”-LMBench评测基准,整合方法、数据集与自动化平台,成为行业公认的“能力标尺”。
在实体经济赋能与产业链强链补链进程中,标准的引领作用愈发凸显。围绕国家“人工智能+”行动部署,该系列标准支撑构建的评测体系,通过对主流大模型的专业评测形成权威白名单,为中央企业、国有企业选型提供科学依据,从源头规避技术应用风险。评测体系已支撑中石化、南方电网等建设行业大模型,完成对华为盘古、讯飞星火、中移动九天等模型的场景验证。
截至目前,标准工具完成千余项评测任务,调用大模型超95万次,精准识别幻觉控制、内容安全等共性问题,助力近30家厂商技术迭代,推动形成“研发—评测—应用—升级”闭环。标准国际化同步推进,面向东盟编制英语、老挝语、高棉语版本,填补区域空白;中国开源模型架构已被新加坡等国项目采用,彰显标准引领下的全球影响力。
业内专家指出,大模型国家标准的落地实施,不仅解决了产业发展的“度量衡”问题,更通过强链固链提升了产业链整体韧性。随着标准在更多行业的深度应用,中国人工智能产业将加速实现从“跟跑”向“领跑”的跨越,为经济高质量发展注入新动能。









