Qumulo推出云AI加速器，旨在提升企业GPU利用率

2026-05-27 08:44

关键词:

维度网讯，Qumulo推出Cloud AI Accelerator，这是一种新型企业AI基础设施方案，能够在无需复制数据、无需分阶段延迟、同时保持数据一致性的前提下，将分布式企业数据实时呈现给跨地域、跨云和混合环境中的GPU资源。

一项近期分析显示，企业GPU平均利用率仅徘徊在5%左右，这意味着价值数千亿美元的加速计算基础设施约95%的时间处于闲置状态。闲置的原因在于，工作负载启动前，数据必须经历分阶段、复制和转移的过程。改进后的token经济学需要计算总体创建时间，而不仅仅是最后一步。

Qumulo Cloud AI Accelerator并未要求企业将海量数据集移动到GPU所在位置，而是采取不同路径。该方案首先消除了导致GPU空闲时间的数据重力和数据分阶段瓶颈，使企业能够构建敏捷的AI基础设施，在几分钟内适应跨云和跨地域变化的GPU可用性，从而创造企业级GPU流动性。

Qumulo的Douglas Gourlay表示，每家企业都关注GPU可用性，但可用性只是问题的一半，更深层的问题是利用率，而罪魁祸首是数据重力。他指出，行业应对措施是向企业销售更紧耦合的存储并直接连接到GPU集群，这种方案仅优化了活跃计算的一个小窗口，对周围空闲时间毫无作为，只会导致更昂贵的token和需要维护的存储孤岛。Cloud AI Accelerator旨在将数据即时传送到任何位置的GPU，无需复制数据。

Qumulo Cloud AI Accelerator通过构建智能数据架构创造GPU流动性，该架构集成了Cloud Native Qumulo（CNQ）、Qumulo Cloud Data Fabric和Qumulo NeuralCache，覆盖本地、边缘和多云环境。这使得企业可以在任何有GPU容量的地点运行工作负载，而非在数据被困住的地方运行。该方式将GPU寻址从成本高昂的物流问题转变为灵活的调度操作，可将任何企业数据集实时传送到任何云中的任何GPU集群。

借助该加速器，企业可实现：无需复制即可连接，安全地将本地或云原生Qumulo系统连接到Microsoft AI Foundry、AWS Bedrock和Google Vertex AI；在任何有GPU容量的地域、云或可用区运行AI工作负载；消除训练或推理工作负载开始前长达数周的数据分阶段延迟；避免在可能提供GPU的每个环境中维护多个孤立的复制存储孤岛；减少因向GPU附加闪存存储的繁重加载阶段而产生的闲置GPU成本。

Cisco的网络、安全与计算在Cloud AI Accelerator架构中发挥基础作用。Cisco统一计算系统（UCS）为本地和混合部署提供可扩展的企业AI计算基础设施，Cisco高性能网络支持在混合和多云AI环境中安全、低延迟地移动数据。Qumulo与Cisco共同提供敏捷的AI基础设施，可在几分钟内适应GPU可用性变化。

Qumulo Cloud AI Accelerator现已在AWS、Azure、Google Cloud和Oracle Cloud Infrastructure（OCI）上可用，并支持基于Cisco UCS的本地混合部署。

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

美国

信息通信智能数据处理人工智能

本文来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告知,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com

上一篇：美国CISA与丹麦优傲机器人联合披露UR机器人高危漏洞

下一篇：美国Rocklin实验室发布180万蛋白质稳定性数据集，推动AI预测