研究团队开发新型3D听觉传感器 推动人机声音交互革新
2025-06-10 15:58
来源:首尔国立大学
收藏

近日,一个研究团队成功开发出一种基于单个麦克风的新型3D听觉传感器,实现了仅通过声音识别人体位置,并促进人与机器人之间的交互。该技术突破了传统声学传感技术的限制,在嘈杂的工厂环境中也展现出卓越性能。

研究团队由首尔国立大学工程学院机械工程系的Sung-Hoon Ahn教授领导,他们通过声源定位和声学通信技术,成功研制出世界上首个“用耳朵看空间”的3D听觉传感器。该传感器集成了两项核心技术:3D声学感知技术和基于声波的双重通信技术。前者能在嘈杂环境下估算人或物体的3D位置,后者则实现了人与机器人以及机器人之间的全新交互方式。

在工业和灾难救援场景中,声音扮演着至关重要的角色。然而,现有的声学传感技术存在精度限制或需要复杂的设备配置,使得实际工业应用面临挑战。为了解决这些问题,研究团队从蝙蝠和海豚的生物学机制中汲取灵感,设计了一种基于元结构的相位抵消机制,可以人工调整来自不同路径的声波的相位,从而放大来自特定方向的声音。通过将该机制与单个麦克风和旋转装置相结合,团队成功将之前只能通过多传感器系统实现的3D声源追踪功能集成到单个传感器中。

此外,受海豚双频通信原理的启发,研究人员还设计了一种双声道,将可听频率和不可听频率区分开来,以减少干扰,并在机器人之间提供独立的通信路径。这种设计促进了工业环境中更复杂的协作场景。目前,该技术已成功应用于实际的机器人平台,并在工厂和日常环境中进行了现场测试。配备该系统的四足机器人能够通过声音与人类进行互动,并检测到气体泄漏的位置。

Sung-Hoon Ahn教授表示,声音可以穿过狭窄的缝隙被听到,这使其成为一种很有前途的新型交互方式。而论文第一作者Semin Ahn则回顾了研究过程,强调开发仅使用一个旋转麦克风就能精确定位声源的3D传感器,为声学传感技术开辟了新的途径。

展望未来,研究团队计划将3DAR系统增强为更先进的机器人听觉系统,并与基于大型语言模型的认知系统相结合,使机器人能够像人类一样理解声音的含义,并将其应用于人形机器人。

更多信息: Semin Ahn 等人,《利用三维声学测距(3DAR)在可听和不可听频率下实现人机及机器人与机器人之间声音交互》,《机器人与计算机集成制造》(2025 年)

本简讯来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com