中国广和通实现VLA端侧推理2.6倍加速
2026-06-30 17:13
收藏

维度网讯,广和通AI研究院在具身智能领域取得关键进展,其自研的FiboVLA框架与端侧推理优化技术,使多个主流VLA模型的推理速度平均提升2.6倍,并完成GR00T N1.5在边缘侧高算力主控平台的部署。相关成果已通过LIBERO仿真基准数据集与桌面双臂真机环境验证,为具身智能模型在机器人端侧高效运行提供工程支撑。

VLA(视觉-语言-动作模型)是具身智能中的关键技术,它整合视觉输入、语言指令与动作生成,使机器人能根据环境与任务指令产生动作。随着VLA模型参数规模激增,机器人在端侧实时推理面临瓶颈。推理速度直接影响机器人的动作响应、任务衔接与运行流畅度。此外,机器人还受到算力、功耗、散热及系统资源等多重限制,如何让复杂VLA模型在端侧高算力主控上稳定、高效运行,成为具身智能落地过程中的关键课题。

针对VLA模型端侧推理负载高的问题,广和通AI研究院采用自研FiboVLA压缩框架,从模型语义层进行Token级优化。在VLA推理过程中,视觉和语言信息存在大量冗余表征。FiboVLA通过精细化视觉Token筛选与压缩,剔除低价值信息,保留与任务理解、环境判断和动作生成强相关的关键内容。该框架减少了推理过程中的无效计算,在保持模型决策精度、跨模态理解能力和动作生成能力的前提下,大幅降低计算负载。同时,团队结合推理链路调度与端侧推理引擎优化,进一步提升模型在机器人端侧的运行效率。经验证,该框架不依赖特定模型架构,已在多个主流前沿VLA模型上验证有效,推理吞吐提升2.6倍,端到端时延得到有效压缩。

基于FiboVLA框架与端侧推理优化技术,广和通AI研究院成功将GR00T N1.5部署至边缘侧高算力主控平台,并完成运行验证。在LIBERO仿真基准数据集中,该框架保证了推理加速后的任务效果;在真实物理环境中,也在桌面双臂机器人场景中完成GR00T N1.5真机运行验证。这意味着机器人可以在端侧更快完成感知、决策与动作生成,形成低延迟、连续化的推理闭环。这不仅是模型速度的提升,也是在真实机器人平台上完成了一次工程验证。

FiboVLA框架的成功应用,进一步沉淀了广和通AI研究院在端侧AI与具身智能方向的核心能力,包括模型压缩、推理引擎优化、机器人平台验证及系统协同能力。面向具身智能加速发展的产业趋势,广和通将持续结合无线通信、边缘算力、AI工具链与Fibot平台能力,帮助机器人和各类智能终端获得更高效、更稳定的本地智能,为具身智能进入真实系统运行提供工程基础。

本文来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com