Google 新机器人 AI 实现精细折纸与拉链袋操作,Gemini Robotics 提升机器人灵巧性
2025-03-16 16:50
收藏

Google DeepMind 推出 Gemini Robotics 和 Gemini Robotics-ER,基于 Gemini 2.0 模型,增强机器人与物理世界的交互能力。Gemini Robotics 具备视觉-语言-行动(VLA)功能,处理视觉信息、理解语言指令并生成动作,适配多样机器人形态,如 ALOHA 2 双臂平台和 Apptronik 的 Apollo 人形机器人。Gemini Robotics-ER 聚焦具身推理,提升空间理解,适配现有控制系统,强化机器人对环境的适应性。Google 强调,Gemini Robotics 在泛化性、交互性和灵巧性上取得突破,性能较其他视觉-语言-行动模型提升超一倍,支持机器人执行新任务,如折叠折纸狐狸或将零食装入拉链袋。

相较 2023 年 RT-2 模型,Gemini Robotics 突破动作复用限制,显著提升灵巧性,执行 RT-2 无法处理的复杂任务,如精细折纸和操作拉链袋,标志着从理解指令到执行精细动作的进步。Google 与 Apptronik 合作开发下一代人形机器人,Gemini Robotics-ER 已向 Boston Dynamics、Agility Robotics 等测试者开放,探索商业与工业应用。安全性方面,Google 采用分层方法,结合碰撞避免与力限制,发布 ASIMOV 数据集评估机器人动作安全,遵循阿西莫夫机器人定律,确保 AI 驱动机器人安全交互。

Gemini Robotics 的泛化能力使其适配未训练场景,解决机器人技术挑战,潜在应用包括家庭与工作场所助手。然而,模型仍处研究阶段,现实环境表现待验证。Google 的进展与 Figure AI、Tesla Optimus 等竞争,行业需解决自主性与安全问题,推动通用机器人发展。

本简讯来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com