维度网讯,当地时间6月22日,美国AI推理芯片公司Groq宣布完成6.5亿美元新一轮增长融资。本轮融资由Disruptive和Infinitum领投,部分现有投资者继续跟投,资金将用于加速扩建Groq AI推理云基础设施。
Groq当前业务重点已转向大规模AI推理云服务。公司目前在北美、欧洲、中东和亚太地区运营13个数据中心,服务超过500万名开发者以及数千家AI原生企业,每周处理数万亿级Token。新资金将用于升级现有数据中心基础设施,并部署Groq最新推理技术,包括NVIDIA LPX系统。
按照公司规划,Groq将在2027年底前把AI推理云总装机规模扩展至200兆瓦。该目标指向的是推理侧算力需求的快速增长。随着AI应用从模型训练和实验验证进入生产部署阶段,企业对低延迟、高并发、成本可控的推理算力需求正在上升,推理云也从辅助型服务变成AI基础设施的重要组成部分。
Groq的核心技术基础是LPU推理处理器架构,主要面向大语言模型等顺序计算任务优化。与训练环节不同,推理服务更强调持续运行、响应速度、单位成本、服务稳定性和规模化调度能力。Groq此次融资后继续扩张云平台,说明其商业重心正在从单纯芯片能力展示,转向可持续交付的推理云服务。
管理团队也同步调整。Alan Rice加入Groq担任首席运营官,此前曾在xAI和Meta数据中心相关岗位任职,并具备大型基础设施运营经验。Sinclair Schuller和Rakesh Malhotra将于7月起分别出任首席技术官和首席产品官,负责推动平台技术和企业级产品建设。
此次融资发生在Groq与英伟达达成非独家技术许可协议之后。Groq表示,英伟达下一代LPX平台已整合Groq推理技术。对Groq而言,技术授权和云业务扩张并行推进,使其不再只依赖自有芯片销售,而是以推理云平台、技术授权和数据中心运营能力共同支撑业务增长。
AI算力市场正在从“谁能训练更大模型”转向“谁能以更低成本稳定运行模型”。训练决定模型能力上限,推理决定应用能否规模化使用。Groq把融资资金投向全球数据中心和200兆瓦级推理云扩容,反映出AI基础设施竞争正在进入持续运营阶段。
Groq接下来的压力也很明确:200兆瓦目标需要电力、机房、液冷、网络、芯片供应和客户负载同步匹配。推理云能否形成长期收入,不只取决于算力规模,也取决于价格竞争力、模型生态、企业客户黏性和服务稳定性。对AI应用公司来说,真正有价值的不是峰值算力,而是能够长期、稳定、低成本调用的推理能力。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









