谷歌非洲研究院推出WAXAL语音数据集,覆盖21种非洲语言
2026-02-03 16:06
收藏
随着智能设备普及,语音交互已成为日常习惯,但全球仍有数亿人因技术无法识别当地语言而难以享受便利。在撒哈拉以南非洲,超过2000种语言的使用使得开发包容性语音技术面临核心难题——高质量语音数据的匮乏。

为应对这一挑战,谷歌非洲研究院联合多国机构发布了WAXAL语音数据集,名称来源于沃洛夫语的“说话”。经过三年筹备,该资源旨在支持研究人员构建覆盖非洲的语音技术。WAXAL语音数据集收录21种语言,包括阿乔利语、豪萨语等,包含近200万条录音,总时长超11000小时。其中约1250小时已转录,可用于自动语音识别;另有20余小时的专业录音适用于文本转语音系统。
这一WAXAL语音数据集的构建由非洲本土机构主导。乌干达马凯雷雷大学与加纳大学负责13种语言采集,卢旺达Digital Umuganda完成5种语言收集。专业录音部分由Media Trust、Loud n Clear合作制作,非洲数学科学研究所则提供了多语言数据以拓展未来应用。合作框架确保数据提供方保留所有权,同时向全球研究社区开放使用。
WAXAL语音数据集通过伦理化方式采集真实语音,既包含日常场景描述,也涵盖专业录音室素材。除推动人工智能研发外,该资源有望促进非洲语言的数字化保存。完整数据集已按开放许可在Hugging Face平台发布,相关技术细节同步发表于研究论文。
相关推荐

苏格兰NMIS试验展示私有5G助力智能制造
2026-06-19

6月18日美国SpaceX市值2.6万亿美元一度超越亚马逊
2026-06-19

美国SpaceX获三大机构投资级信用评级,展望稳定
2026-06-19

美国Coupa推出代理框架,Q1支出超5000亿美元
2026-06-19

三大开源峰会9月在中国上海联合举办
2026-06-19

iKOMG与欧洲广播公司签多平台分发协议
2026-06-19

美国Baseten筹集15亿美元融资
2026-06-19

中国人大与微软研究院推出Arbor框架 性能提升超2.5倍
2026-06-19

美国波音Q4S量子纠缠交换测试成功,计划2027年发射
2026-06-19

印度Hexaware Technologies投资2500万英镑扩张英国研发及量子计算
2026-06-19
最新简讯