Qumulo推出云AI加速器,旨在提升企业GPU利用率
2026-05-27 08:44
收藏

维度网讯,Qumulo推出Cloud AI Accelerator,这是一种新型企业AI基础设施方案,能够在无需复制数据、无需分阶段延迟、同时保持数据一致性的前提下,将分布式企业数据实时呈现给跨地域、跨云和混合环境中的GPU资源。

一项近期分析显示,企业GPU平均利用率仅徘徊在5%左右,这意味着价值数千亿美元的加速计算基础设施约95%的时间处于闲置状态。闲置的原因在于,工作负载启动前,数据必须经历分阶段、复制和转移的过程。改进后的token经济学需要计算总体创建时间,而不仅仅是最后一步。

Qumulo Cloud AI Accelerator并未要求企业将海量数据集移动到GPU所在位置,而是采取不同路径。该方案首先消除了导致GPU空闲时间的数据重力和数据分阶段瓶颈,使企业能够构建敏捷的AI基础设施,在几分钟内适应跨云和跨地域变化的GPU可用性,从而创造企业级GPU流动性。

Qumulo的Douglas Gourlay表示,每家企业都关注GPU可用性,但可用性只是问题的一半,更深层的问题是利用率,而罪魁祸首是数据重力。他指出,行业应对措施是向企业销售更紧耦合的存储并直接连接到GPU集群,这种方案仅优化了活跃计算的一个小窗口,对周围空闲时间毫无作为,只会导致更昂贵的token和需要维护的存储孤岛。Cloud AI Accelerator旨在将数据即时传送到任何位置的GPU,无需复制数据。

Qumulo Cloud AI Accelerator通过构建智能数据架构创造GPU流动性,该架构集成了Cloud Native Qumulo(CNQ)、Qumulo Cloud Data Fabric和Qumulo NeuralCache,覆盖本地、边缘和多云环境。这使得企业可以在任何有GPU容量的地点运行工作负载,而非在数据被困住的地方运行。该方式将GPU寻址从成本高昂的物流问题转变为灵活的调度操作,可将任何企业数据集实时传送到任何云中的任何GPU集群。

借助该加速器,企业可实现:无需复制即可连接,安全地将本地或云原生Qumulo系统连接到Microsoft AI Foundry、AWS Bedrock和Google Vertex AI;在任何有GPU容量的地域、云或可用区运行AI工作负载;消除训练或推理工作负载开始前长达数周的数据分阶段延迟;避免在可能提供GPU的每个环境中维护多个孤立的复制存储孤岛;减少因向GPU附加闪存存储的繁重加载阶段而产生的闲置GPU成本。

Cisco的网络、安全与计算在Cloud AI Accelerator架构中发挥基础作用。Cisco统一计算系统(UCS)为本地和混合部署提供可扩展的企业AI计算基础设施,Cisco高性能网络支持在混合和多云AI环境中安全、低延迟地移动数据。Qumulo与Cisco共同提供敏捷的AI基础设施,可在几分钟内适应GPU可用性变化。

Qumulo Cloud AI Accelerator现已在AWS、Azure、Google Cloud和Oracle Cloud Infrastructure(OCI)上可用,并支持基于Cisco UCS的本地混合部署。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com