中国教育部、国家语委发布两项语言文字新规范,填补人工智能领域语言标准空白
2026-03-28 10:02
收藏

为积极回应人工智能时代对语言文字的现实需求,推进语言文字规范标准体系建设,教育部、国家语言文字工作委员会近日正式发布《机器合成普通话水平测评等级标准及测评大纲》和《人工智能 语料库 基础术语》两项语言文字规范。这是中国首次针对人工智能领域制定专项语言文字标准,填补了该领域的规范空白。

《机器合成普通话水平测评等级标准及测评大纲》聚焦于语音合成技术,对机器合成普通话的清晰度、自然度、可懂度等关键指标进行分级界定,并制定了相应的测评方法和等级标准。随着生成式AI的普及,语音合成技术已广泛应用于智能客服、语音助手、有声读物等场景,但长期以来缺乏统一的评测标准。该规范的出台,将为语音合成产品的质量评估提供科学依据,推动技术向更高水平发展。

《人工智能 语料库 基础术语》则针对AI训练所依赖的语料库,统一和规范了语料采集、标注、清洗、管理等相关基础术语,为人工智能领域的数据治理和标准化建设奠定了语言基础。语料库的质量直接决定了AI模型的训练效果,术语的统一有助于规范行业操作,降低跨机构、跨平台的数据交换成本,提升中文语料库的标准化水平。

两项规范由教育部语言文字应用研究所(国家语委普通话与文字应用培训测试中心)组织研制,经国家语委语言文字规范(标准)审定委员会审定通过,目前已由语文出版社正式出版。

随着人工智能技术的快速发展,语言文字作为人机交互的基础载体,其标准化工作日益重要。此次两项规范的发布,既是中国语言文字工作主动适应技术变革的重要举措,也为人工智能产业健康发展提供了基础支撑。教育部、国家语委表示,将继续围绕人工智能语言应用领域,持续推进相关标准的研制工作。

本简讯来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com