美国液态AI发布8B边缘模型，推理仅激活1.5B

2026-06-04 11:51

关键词:

维度网讯，脱胎于麻省理工学院的人工智能企业液态AI（Liquid AI）近日发布了一款新模型LFM2.5-8B-A1B，该模型总参数量为8B，但每次推理仅激活1.5B参数，实际动用算力不到总参数的五分之一。这一模型专为手机、PC、机器人及轻量服务端等边缘场景设计，不参与云端大模型竞争。

过去两年，业界为使大模型运行于物联网设备，普遍采用量化、剪枝、蒸馏等方法，将原本为云端设计的大型模型压缩后部署至边缘设备。液态AI则采取了不同技术路线，其思路在于改变模型的“进食方式”，使模型处理简单任务时消耗较少资源，仅在面对复杂任务时才调用更多算力。具体而言，模型每一次推理所消耗的能量与输入任务的难易程度直接挂钩，这通过混合专家模型（MoE）的稀疏激活机制实现：系统面对某一输入任务时，只唤醒最相关的几个专家模块，其余部分保持休眠状态。

在边缘端，智能化的核心约束从算力成本转向能耗成本。一枚嵌入式芯片每完成一次推理所消耗的能量（以焦耳计）是有限且固定的。量化、剪枝、蒸馏等方法虽可缩小模型体积，但未改变模型每次推理均需遍历全部参数的模式，在严苛的电池约束下难以持续。液态AI的技术路径在于使消耗的算力随输入任务难易程度动态变化，即实现“输入自适应计算”。这一思路源于对秀丽隐杆线虫的研究，该线虫全身仅302个神经元，但其智能依赖神经元之间突触连接强度的动态变化，而非依赖规模堆砌。

LFM2.5模型在保留高效底层算子的同时，叠加了MoE稀疏激活机制，其8B参数总量、每次推理仅激活约1.5B的底层逻辑即在于此。液态AI的技术路线从早期的连续时间动态网络迭代至当前的稀疏激活架构，共享的核心是使计算量随输入变化。此外，该技术流派还关注模型部署后的鲁棒性。区别于静态模型，液态神经网络通过连续时间方程和自适应的时间常数建模，其内部状态可“流动”并根据输入信号节奏实时调整。麻省理工学院计算机科学与人工智能实验室（MIT CSAIL）的多次演示表明，由这类网络驱动的智能体在陌生环境中仍能稳健导航，应对环境漂移。相比依赖OTA远程升级推送新模型的方法，这种原生具备鲁棒性的架构能防御尚未出现的未知扰动。

在端侧智能时代，产业价值正在从模型与芯片两端向二者之间的协同层迁移。液态AI推出的LFM模型在架构设计之初即针对硬件兼容性进行优化，官方宣称可无缝运行于GPU、CPU或NPU之上，涵盖可穿戴设备、机器人、手机、PC及汽车等异构设备。该公司于今年1月与AMD达成合作，用时两周即在后者Ryzen AI处理器上完成了2.6B（26亿参数）模型的本地化定制与部署。这种效率背后的核心能力，是在极端硬件约束下迅速逼近最优算子组合与最低内存占用的工程化能力。

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

美国