中国阿里巴巴发布Qwen-Robot Suite三款机器人AI模型
2026-06-19 11:41
收藏

维度网讯,阿里巴巴工程师发布了由三款基础AI模型组成的Qwen-Robot Suite,这些模型专为机器人和智能体设计,不仅能理解文本和图像,还可在物理世界中执行操作。

该套件包含三种模型,分别面向不同的机器人任务需求。

Qwen-RobotNav是一种集成多种导航场景的模型,涵盖指令跟随、前往指定点、物体搜索、目标追踪和自动驾驶等功能。该模型被定位为智能体系统导航的基础模型,外部规划器可将其与大任务分解后的小任务结合,并在执行过程中动态切换模型模式。

该模型支持配置观察协议,使系统在处理视觉上下文时实现动态调整,例如调整token数量或不同摄像头的权重。工程师在1560万个样本上对其进行了训练,参数量从20亿扩展到80亿以提升性能。

Qwen-RobotManip是基于Qwen-VL的视觉-语言-动作模型,专门负责与物体的物理交互。该模型旨在解决机器人数据异质性问题,即不同机器人因结构、传感器和控制方式不同而带来的差异。

为解决这一问题,Qwen-RobotManip采用了表示、动作和行为的对齐机制,使得开发者能够更简便地实现不同机器人之间的技能迁移。该模型在一个包含3.8万段视频、机器人数据及合成数据的数据集上完成训练。

Qwen-RobotWorld是一种世界模型,能够根据实时观测和文本指令“预测”物理环境的演进趋势。该模型可针对不同场景生成未来的视觉轨迹。

目前,该套件中所有模型均已开源并可在官方页面查看演示视频。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com