美国麻省理工学院研发新系统 推动机器人快速3D建图定位
2025-11-06 14:21
来源:麻省理工学院
收藏

在机器人执行搜救任务或复杂环境导航时,同步定位与建图(SLAM)技术至关重要。然而,传统方法在处理大量图像时效率低下,限制了机器人在真实灾难场景中的应用。麻省理工学院研究人员开发出一种新系统,通过拼接场景子图实现快速3D重建与实时定位,为机器人导航提供了更高效的解决方案。

该人工智能驱动系统逐步创建并对齐场景中的较小子地图,并将它们拼接起来重建完整的3D地图,例如办公室隔间的地图,同时实时估计机器人的位置。

该系统借鉴经典计算机视觉与最新AI模型,将复杂场景分解为多个子图,并通过数学变换对齐拼接,形成完整3D地图。与依赖校准相机或专家调整的传统方法不同,新系统仅需机器人机载摄像头拍摄的图像,即可在几秒内生成精确3D重建,同时实时估计机器人位置。例如,在包含8个子图的办公场景测试中,系统成功重建了55米环形路线的3D模型,平均误差小于5厘米。

研究团队负责人卢卡·卡隆表示:“我们结合了基于学习的方法与传统优化技术,开发出一种灵活且高效的数学工具,能够处理子图中的形变问题。”这一突破不仅提升了机器人导航的可靠性,还降低了实际应用门槛。系统无需特殊设备,仅用手机拍摄的短视频即可重建复杂场景(如教堂内部),为扩展现实(XR)应用、工业机器人仓储管理等场景提供了技术支持。

“开箱即用的工具让3D重建更易实现,”论文第一作者多米尼克·马吉奥强调,“未来我们将优化系统在极端复杂环境中的表现,推动其向真实机器人部署。”该成果已发表于arXiv预印本服务器,并将在神经信息处理系统会议上展示。

更多信息: Dominic Maggio 等人,《VGGT-SLAM:基于 SL(4) 流形优化的密集 RGB SLAM》,arXiv (2025)。期刊信息: arXiv

本简讯来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com