自动驾驶汽车、无人机等智能系统如何像人类一样理解世界,准确识别行人、自行车等物体,一直是技术挑战。考纳斯科技大学(KTU)的研究团队近期在《遥感应用:社会与环境》发表文章,介绍了一种提升3D点云处理效率的新模型,有望解决这一问题。

3D点云是通过激光测量创建的三维地图,用于分析物体形状和场景上下文。KTU教授Rytis Maskeliūnas解释:“想象对街道或城市进行数百万次测量,拼接成点组成的地图,这就是3D点云。”这项技术已应用于日常,如车辆自动紧急制动,但复杂条件下可靠性仍不足。
3D点云数据还用于构建城市数字模型,支持规划监控,形成数字孪生基础。然而,KTU研究员Sarmad Maqsood博士指出:“计算机分析3D点云面临困难,因为数据不规则、海量且不均匀。”实时处理需要高计算能力,而噪声、遮挡等挑战使分析复杂化。
为此,KTU研究人员开发了新模型,整合局部和全局视角,结合基于transformer的分析和优先处理机制,更好处理不平衡数据。Maskeliūnas说:“模型像智能拼图解谜器,通过分析场景关系和强调重要特征,改进对小或部分可见物体的检测。”例如,自动驾驶汽车在黄昏能识别部分遮挡行人,提升安全性。
该模型效率高,每帧处理复杂场景仅需两秒多,保持高精度。Maqsood补充:“系统集成了压缩和传输,允许大规模3D数据近实时处理。”未来应用可扩展至送货无人机、搜救机器人、考古学和增强现实等领域,推动机器从“看”到“理解”世界的进步。
出版详情:作者:Kaunas University of Technology;标题:《Digital twins to rescue robots: What faster 3D point cloud processing enables》;发表于:《Remote Sensing Applications: Society and Environment》(2026)。












