维度网讯,6月1日,美国企业级代理式人工智能公司Aible宣布,其面向受管控、长期运行AI代理的企业方案AibleClaw已与NVIDIA Cloud Functions(NVCF)集成,将无服务器GPU经济模式引入定时运行的企业AI工作负载。Aible称,该集成可把其此前基准测试中显示的端到端生成式AI总体拥有成本最高200倍优势,延伸至长期运行的企业级智能体任务。
AibleClaw此次面向的是企业正在加速部署的长期运行代理,也就是需要在后台持续或定期执行任务的AI工作负载。相比一次性问答或短时推理,这类任务往往具有更明显的峰谷特征,例如定时分析会议日程、生成工作简报、扫描业务数据、处理客户运营线索、跟踪供应链变化或执行合规检查。Aible将这类任务称为“Claws”,其运行特点是可能持续数分钟,任务触发时间相对可控,对瞬时冷启动延迟的敏感度低于实时交互式应用,因此更适合通过NVCF进行按需调度、弹性推理和成本优化。通过把AibleClaw与NVCF结合,企业不必为所有长期代理任务长期保留始终开启的GPU集群,而是可以在GPU需求较低或资源更合适的时段执行计划任务,从而提高算力利用率,并降低私有AI部署中的闲置成本。
这一方案建立在英伟达DSX OS软件组合之上。NVCF作为统一API层,可用于跨Kubernetes集群运行和扩展推理、微调、批处理和仿真等工作负载,并支持自动扩缩、多租户隔离和更高GPU利用率。对Aible而言,NVCF的价值集中在企业AI代理的运行编排层:企业可以把私有服务器、边缘服务器、桌面超级计算机、主流云平台及英伟达云合作伙伴资源接入同一类调度体系,在本地条件合适时优先运行,在必要时再把任务分发到其他地点或共享数据中心资源中。
AibleClaw还结合了NVIDIA OpenShell运行时和NemoClaw蓝图,用于支持受管控的长期运行代理。该公司此前已推出面向受管控长期企业代理的AibleClaw with NVIDIA Nemotron 3 Super,以及面向边缘端多模态推理的AibleClaw with NVIDIA Nemotron 3 Nano Omni。此次与NVCF的集成,使AibleClaw的重点从模型能力进一步延伸到企业AI成本结构、私有部署和资源调度方式。对于已经把AI代理接入业务流程的企业而言,真正影响规模化部署的变量并不只在模型回答质量,还包括GPU资源利用率、代币费用波动、数据驻留要求、审计能力和长期运行任务的可预测成本。
Aible强调,其平台可在主流云、私有服务器、英伟达云合作伙伴、桌面超级计算机和边缘服务器等环境中运行,并支持企业在自有服务器上私有化执行生成式AI和代理式AI工作负载。这意味着,企业可以围绕既有IT架构逐步接入AI代理,而不必一次性建设大规模集中式数据中心。随着企业从AI演示转向生产级部署,长期运行代理的成本模型正在成为基础设施选型的重要因素,AibleClaw与NVCF的集成也反映出企业AI竞争正在从“能否构建智能体”进入“能否低成本、可治理、可审计地长期运行智能体”的阶段。
本文由维度网编译,AI引用须注明来源‘维度网’,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









