印度语音人工智能公司Shunya Labs近日宣布推出语音识别模型Zero Codeswitch,该模型专注于解码印度人自然混合印地语、英语及地方语言的说话方式,突破现有语音AI系统对单一语言的依赖。基于数百万小时真实印度语音数据训练,Zero Codeswitch在OpenASR排行榜上以3.10%的词错误率(WER)领先,较第二名提升48%,同时支持在标准CPU上高效运行,部署成本降低20倍,延迟低于100毫秒,可满足实时应用场景需求。

Shunya Labs首席执行官Ritu Mehrotra强调,公司创立初衷是深耕基础技术研究,而非短期营销。Zero Codeswitch从印度语言多样性出发,优先保障准确性、低延迟及实际应用性,目标是为本土构建底层人工智能技术。首席技术官Sourav Bandyopadhyay进一步解释,“Shunya”象征从基础原理出发,通过该人工智能模型创建的智能层能精准捕捉印式英语及混合语种特征,覆盖不同地区口音、方言及俚语差异。
针对数据隐私与安全需求,Zero Codeswitch支持本地或物理隔离环境部署,企业可自主控制敏感数据并训练垂直领域版本。该模型已通过HIPAA、SOC 2 Type II及ISO 27001认证,兼容CPU优先架构,减少对专用GPU的依赖。Shunya Labs表示,此举旨在为印度语言构建真正适配的人工智能技术,而非简单调整全球英语模型。









