维度网讯,近日,美国AI推理芯片企业Groq计划向现有投资者融资最高6.5亿美元,用于推进其AI推理neocloud业务。该融资计划出现在Groq与英伟达达成大型授权协议之后,显示公司正把后续重心进一步转向基于自研芯片和系统的推理云服务。
Groq早期以自研Language Processing Unit(LPU)芯片进入AI计算市场,主攻大模型推理场景。与训练相比,推理承担的是模型上线后的响应、生成、调用和服务交付,直接关系到AI应用的时延、吞吐、成本和用户体验。随着大模型从测试走向生产环境,企业不只需要训练算力,也需要能够稳定支撑聊天机器人、代码生成、搜索增强、智能客服、企业智能体和多模态应用的推理基础设施。所谓neocloud,通常指面向AI工作负载的新型云服务商或专用云平台,核心竞争力不是传统通用云资源,而是围绕GPU、专用AI芯片、推理引擎、模型服务和高并发调度形成的算力交付能力。Groq此次计划融资,正是为了把芯片能力进一步包装成面向客户的推理云服务,而不是只停留在硬件销售或单点芯片性能展示。
这项融资计划也反映出AI基础设施市场正在从“训练算力争夺”延伸到“推理服务交付”。Groq此前在2024年完成6.4亿美元D轮融资,估值达到28亿美元,资金用途包括扩大AI推理计算技术部署和数据中心能力。 随着生成式AI应用调用量上升,推理成本会成为企业持续使用AI的主要压力之一,低时延、高吞吐、可扩展的推理平台因此更容易获得市场关注。Axios和Reuters相关信息显示,Groq此次计划向现有投资者融资最高6.5亿美元,外界也将其视为公司在英伟达授权交易后的“第二阶段”布局。 需要注意的是,这仍属于计划融资和市场报道阶段,不能直接写成融资已经完成,也不能等同于Groq推理neocloud业务已经形成大规模商业收入。
后续观察重点将集中在Groq是否完成6.5亿美元融资、融资后估值和投资方结构、推理neocloud平台扩容节奏,以及其LPU架构能否在大模型高并发调用中持续体现成本和时延优势。美国Groq计划融资扩展推理neocloud业务,说明AI算力竞争正在从芯片硬件、训练集群,进一步转向可商业交付的推理云平台和企业级AI服务能力。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









