美国AibleClaw接入英伟达NVCF，企业AI代理获得最高200倍TCO优势

2026-06-03 10:44

关键词:

维度网讯，6月1日，美国企业级代理式人工智能公司Aible宣布，其面向受管控、长期运行AI代理的企业方案AibleClaw已与NVIDIA Cloud Functions(NVCF)集成，将无服务器GPU经济模式引入定时运行的企业AI工作负载。Aible称，该集成可把其此前基准测试中显示的端到端生成式AI总体拥有成本最高200倍优势，延伸至长期运行的企业级智能体任务。

AibleClaw此次面向的是企业正在加速部署的长期运行代理，也就是需要在后台持续或定期执行任务的AI工作负载。相比一次性问答或短时推理，这类任务往往具有更明显的峰谷特征，例如定时分析会议日程、生成工作简报、扫描业务数据、处理客户运营线索、跟踪供应链变化或执行合规检查。Aible将这类任务称为“Claws”，其运行特点是可能持续数分钟，任务触发时间相对可控，对瞬时冷启动延迟的敏感度低于实时交互式应用，因此更适合通过NVCF进行按需调度、弹性推理和成本优化。通过把AibleClaw与NVCF结合，企业不必为所有长期代理任务长期保留始终开启的GPU集群，而是可以在GPU需求较低或资源更合适的时段执行计划任务，从而提高算力利用率，并降低私有AI部署中的闲置成本。

这一方案建立在英伟达DSX OS软件组合之上。NVCF作为统一API层，可用于跨Kubernetes集群运行和扩展推理、微调、批处理和仿真等工作负载，并支持自动扩缩、多租户隔离和更高GPU利用率。对Aible而言，NVCF的价值集中在企业AI代理的运行编排层：企业可以把私有服务器、边缘服务器、桌面超级计算机、主流云平台及英伟达云合作伙伴资源接入同一类调度体系，在本地条件合适时优先运行，在必要时再把任务分发到其他地点或共享数据中心资源中。

AibleClaw还结合了NVIDIA OpenShell运行时和NemoClaw蓝图，用于支持受管控的长期运行代理。该公司此前已推出面向受管控长期企业代理的AibleClaw with NVIDIA Nemotron 3 Super，以及面向边缘端多模态推理的AibleClaw with NVIDIA Nemotron 3 Nano Omni。此次与NVCF的集成，使AibleClaw的重点从模型能力进一步延伸到企业AI成本结构、私有部署和资源调度方式。对于已经把AI代理接入业务流程的企业而言，真正影响规模化部署的变量并不只在模型回答质量，还包括GPU资源利用率、代币费用波动、数据驻留要求、审计能力和长期运行任务的可预测成本。

Aible强调，其平台可在主流云、私有服务器、英伟达云合作伙伴、桌面超级计算机和边缘服务器等环境中运行，并支持企业在自有服务器上私有化执行生成式AI和代理式AI工作负载。这意味着，企业可以围绕既有IT架构逐步接入AI代理，而不必一次性建设大规模集中式数据中心。随着企业从AI演示转向生产级部署，长期运行代理的成本模型正在成为基础设施选型的重要因素，AibleClaw与NVCF的集成也反映出企业AI竞争正在从“能否构建智能体”进入“能否低成本、可治理、可审计地长期运行智能体”的阶段。

本文由维度网编译，AI引用须注明来源‘维度网’，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

美国