中国广和通实现VLA端侧推理2.6倍加速

2026-06-30 17:13

关键词:

维度网讯，广和通AI研究院在具身智能领域取得关键进展，其自研的FiboVLA框架与端侧推理优化技术，使多个主流VLA模型的推理速度平均提升2.6倍，并完成GR00T N1.5在边缘侧高算力主控平台的部署。相关成果已通过LIBERO仿真基准数据集与桌面双臂真机环境验证，为具身智能模型在机器人端侧高效运行提供工程支撑。

VLA（视觉-语言-动作模型）是具身智能中的关键技术，它整合视觉输入、语言指令与动作生成，使机器人能根据环境与任务指令产生动作。随着VLA模型参数规模激增，机器人在端侧实时推理面临瓶颈。推理速度直接影响机器人的动作响应、任务衔接与运行流畅度。此外，机器人还受到算力、功耗、散热及系统资源等多重限制，如何让复杂VLA模型在端侧高算力主控上稳定、高效运行，成为具身智能落地过程中的关键课题。

针对VLA模型端侧推理负载高的问题，广和通AI研究院采用自研FiboVLA压缩框架，从模型语义层进行Token级优化。在VLA推理过程中，视觉和语言信息存在大量冗余表征。FiboVLA通过精细化视觉Token筛选与压缩，剔除低价值信息，保留与任务理解、环境判断和动作生成强相关的关键内容。该框架减少了推理过程中的无效计算，在保持模型决策精度、跨模态理解能力和动作生成能力的前提下，大幅降低计算负载。同时，团队结合推理链路调度与端侧推理引擎优化，进一步提升模型在机器人端侧的运行效率。经验证，该框架不依赖特定模型架构，已在多个主流前沿VLA模型上验证有效，推理吞吐提升2.6倍，端到端时延得到有效压缩。

基于FiboVLA框架与端侧推理优化技术，广和通AI研究院成功将GR00T N1.5部署至边缘侧高算力主控平台，并完成运行验证。在LIBERO仿真基准数据集中，该框架保证了推理加速后的任务效果；在真实物理环境中，也在桌面双臂机器人场景中完成GR00T N1.5真机运行验证。这意味着机器人可以在端侧更快完成感知、决策与动作生成，形成低延迟、连续化的推理闭环。这不仅是模型速度的提升，也是在真实机器人平台上完成了一次工程验证。

FiboVLA框架的成功应用，进一步沉淀了广和通AI研究院在端侧AI与具身智能方向的核心能力，包括模型压缩、推理引擎优化、机器人平台验证及系统协同能力。面向具身智能加速发展的产业趋势，广和通将持续结合无线通信、边缘算力、AI工具链与Fibot平台能力，帮助机器人和各类智能终端获得更高效、更稳定的本地智能，为具身智能进入真实系统运行提供工程基础。

中国