冰岛Treble开发基于物理模拟的AI声学程序
2026-06-24 10:29
收藏

维度网讯,冰岛初创公司Treble开发了一款基于物理模拟的声学程序,旨在替代当前AI声音开发中依赖大量试错的传统方法,帮助工程师为机器人、可穿戴设备以及其他智能设备创建AI生成的声音。该公司成立于5年前,总部位于冰岛。

Treble的平台利用声学模拟和空间音频领域的专利算法。公司声称,这些算法能够以远超现有模拟方法的速度,实现达到测量级精度的声学真实感。“声音一直被人们忽视,”Treble首席执行官Finnur Pind在接受《设计新闻》(Design News)采访时表示,“AI需要训练才能教会机器人识别声音和语音。AI需要经历大量的声音场景。”Pind向《设计新闻》解释说,当前声学模拟方法依赖几何声学,涉及声音的高频近似,这种方法并不总是准确。相比之下,Treble的声学模拟方法基于数值波动声学模拟,通过捕捉衍射、相位和散射等波动现象直接求解波动方程。

音频AI的性能受房间声学和混响、声源距离和定位、竞争扬声器和背景噪声,以及麦克风特性和设备放置位置等声学因素影响。更精确的声学模拟能够实现多通道语音增强,降低词错误率。Treble的混合算法通过精确建模单次反射、衍射和耦合房间动力学,超越了传统软件,能够在复杂场景中实现精确模拟,并捕捉其他方法遗漏的低频效果。

Treble还能实现自身语音传播和多麦克风设备声学的逼真模拟,为语音AI、耳机、耳塞和先进麦克风阵列系统生成高保真的训练和测试数据。公司称,该模拟平台可用于语音AI和对话系统、生成合成音频数据、音频硬件虚拟原型、机器人和嵌入式AI、汽车声学和信息娱乐系统,以及空间音频和沉浸式数据。Pind预计,该模拟平台将缩短这些应用的开发时间。

考虑到语音的广泛变异性,Treble开发了一个排行榜,提供全面、易用且由社区驱动的基准测试,以评估反映真实部署场景的自动语音识别性能。评估条件基于实际最终用户的远场场景,基准测试结果按不同场景(例如容易、中等、困难)划分,以提供更多洞察。据Pind称,Treble将完善未来版本的AI声音平台,使没有声学知识的用户也能更轻松地使用该工具。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com