中国阿里巴巴发布Qwen-Robot Suite三款机器人AI模型

2026-06-19 11:41

关键词:

机器人人工智能

维度网讯，阿里巴巴工程师发布了由三款基础AI模型组成的Qwen-Robot Suite，这些模型专为机器人和智能体设计，不仅能理解文本和图像，还可在物理世界中执行操作。

该套件包含三种模型，分别面向不同的机器人任务需求。

Qwen-RobotNav是一种集成多种导航场景的模型，涵盖指令跟随、前往指定点、物体搜索、目标追踪和自动驾驶等功能。该模型被定位为智能体系统导航的基础模型，外部规划器可将其与大任务分解后的小任务结合，并在执行过程中动态切换模型模式。

该模型支持配置观察协议，使系统在处理视觉上下文时实现动态调整，例如调整token数量或不同摄像头的权重。工程师在1560万个样本上对其进行了训练，参数量从20亿扩展到80亿以提升性能。

Qwen-RobotManip是基于Qwen-VL的视觉-语言-动作模型，专门负责与物体的物理交互。该模型旨在解决机器人数据异质性问题，即不同机器人因结构、传感器和控制方式不同而带来的差异。

为解决这一问题，Qwen-RobotManip采用了表示、动作和行为的对齐机制，使得开发者能够更简便地实现不同机器人之间的技能迁移。该模型在一个包含3.8万段视频、机器人数据及合成数据的数据集上完成训练。

Qwen-RobotWorld是一种世界模型，能够根据实时观测和文本指令“预测”物理环境的演进趋势。该模型可针对不同场景生成未来的视觉轨迹。

目前，该套件中所有模型均已开源并可在官方页面查看演示视频。

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

中国

机械制造信息通信智能系统工程人工智能

智能制造工程

本文来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告知,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com

上一篇：芬兰诺基亚与t3为Aureon在美部署400T超高速光网

下一篇：美国白宫与Anthropic合作制定AI安全评估标准

CCD自动寻边激光切割机CT-UV015D

相关视频

沉浸式观光新体验！西安海市蜃楼观光车惊艳启程