康奈尔大学研究人员近日开发出一种名为DRAWER的人工智能流程,该技术能自动将房间短视频转化为交互式3D模拟,即高度精确的“数字孪生”。用户在此数字空间中可自由打开抽屉、橱柜,触摸台面物品,实现沉浸式交互体验。DRAWER技术不仅可用于开发更逼真的视频游戏,还能虚拟训练机器人在特定真实空间内操作,为需要逼真、可交互房间模型的应用提供新可能。

“现有技术虽能合成现实世界不同视角,但缺乏沉浸式体验,无法真正互动。”康奈尔大学计算机科学助理教授马伟秋表示,“得益于生成式人工智能技术进步,我们朝着创建可交互数字孪生迈出了一小步。”6月15日,项目合作伙伴伊利诺伊大学香槟分校博士生夏宏驰,在田纳西州纳什维尔举行的IEEE/CVF计算机视觉与模式识别会议上,展示了“DRAWER:基于环境真实感的数字重建与表达”项目。
DRAWER技术创建数字孪生过程简便,仅需几分钟拍摄即可开始。夏宏驰称:“输入只需一段随意拍摄的厨房视频,无需与橱柜门或物品互动,使用iPhone即可,无需先进视频设备。”为将视频转化为逼真互动数字房间,研究人员整合多个人工智能模型,结合两种渲染方法,添加感知模块确定可移动部分,并填充不可见部分。夏宏驰表示,开发DRAWER需将各模块整合到统一框架中,他已用此方法重新设计了厨房、浴室和办公室。该技术生成的数字孪生可与游戏引擎无缝协作,研究团队已通过创建游戏证明这一点。此外,DRAWER还能通过“真实-模拟-真实”迁移过程,虚拟训练机器人在现实环境中运行。
目前,DRAWER技术仅适用于刚性物体,但研究人员计划将其扩展到柔软或可变形物体。同时,他们希望将工作扩展到整栋建筑,并创建户外空间数字孪生,以应用于城市设计或优化农业产量。夏宏驰说:“我们的最终目标是尝试构建世界上一切事物的数字孪生,未来有很多东西可以探索。”













京公网安备 11010802043282号