Majestic Labs发布Prometheus AI服务器,单机配置128 TB内存突破内存墙瓶颈
2026-04-29 15:50
收藏

维度网讯,据Majestic Labs于2026年4月28日通过Business Wire发布的公告,该公司正式推出Prometheus AI服务器,这是首款专为攻克AI“内存墙”而设计的服务器系统。Prometheus在单个标准尺寸服务器机箱内集成最高128 TB的共享连续内存,将全内存空间以全带宽连接至所有处理单元。公告指出,单台Prometheus可提供的性能,此前需要多个机架的传统服务器才能实现。该产品定位为传统GPU中心化设计的替代方案,旨在解决处理器因等待分散内存层次结构间的数据移动而导致利用率不足的问题。

Prometheus内部搭载自研AI处理单元Ignite。据Majestic Labs公告,Ignite是首款围绕内存优先架构构建的多处理器芯片,在同一芯片和统一内存空间内融合了数据中心级ARM应用核心与RISC-V向量引擎及张量引擎。该架构可在单一节点中支持数万亿参数模型、数亿Token的超大上下文窗口,以及混合专家系统、智能体AI系统、图神经网络等新兴工作负载。此前这类负载通常依赖分布式基础设施才能运行。

“Prometheus代表了AI基础设施首次以内存为一级公民从零重新构想。”Majestic Labs联合创始人兼CEO Ofer Shacham在公告中表示,AI模型规模与上下文窗口越大、多模态协同越深入,系统优势就越显著,Prometheus正是为移除容量与带宽限制而构建,使组织能规模化部署此前无法运行的复杂AI系统。联合创始人兼总裁Sha Rabii在公告中称,行业已无法承受因机器与负载不匹配带来的效率折损,AI系统需同时具备海量内存、高效向量张量处理能力和紧耦合高性能CPU三大要素。

在软件兼容性方面,Prometheus支持PyTorch、vLLM及OpenAI Triton等标准框架。据Majestic Labs公告,开发者无需修改代码即可迁移现有工作负载。联合创始人兼COO Masumi Reynders在公告中指出,团队在Google和Meta十多年与内部开发者协作中的核心经验是:当客户被迫在性能与生产力之间做选择时,他们永远选择生产力。因此“Day 1生产力”成为设计北极星,系统必须开箱即用、零切换成本。

据Business Wire公告,Majestic Labs由Ofer Shacham、Sha Rabii与Masumi Reynders于2023年创立,三人此前共同领导了Meta Reality Labs的定制芯片团队和Google的GChips部门,累计出货数亿颗定制芯片。公司总部设于旧金山与以色列特拉维夫,2025年完成1亿美元A轮融资。据公告,公司团队正重点扩大芯片设计、系统工程和AI数据科学方向的工程力量,并完善配套软件栈。

AWS全球初创企业与风险投资负责人Jason Bennett在公告中评论称,随着AI模型规模和复杂度持续增长,内存带宽已成为关键瓶颈,Majestic Labs选择在AWS上从零重构AI基础设施,其所代表的内存优先思维方向正是行业所需。据公告,Prometheus目前处于早期客户开发阶段,预计2026年内向更广泛市场开放。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com