Meta 与 Groq 携手快速 AI 推理,提升 Llama API 性能
人工智能推理领域的领导者 Groq 宣布与 Meta 合作,为官方 Llama API 提供快速推理功能,为开发人员提供运行最新 Llama 模型的最快、最具成本效益的方式。

现已推出预览版的 Llama 4 API 模型,由 Groq 加速,将在全球最高效的推理芯片 Groq LPU 上运行。这意味着开发者可以运行 Llama 模型,无需任何权衡:低成本、快速响应、可预测的低延迟以及针对生产工作负载的可靠扩展。
Groq 和 Meta 宣布以最快、成本最低的方式运行世界上最值得信赖的公开模型。
与通用 GPU 堆栈不同,Groq 垂直集成,只用于一项任务:推理。越来越多的构建者转向 Groq,因为从定制芯片到云交付,每一层都经过精心设计,旨在提供一致的速度和成本效益,且不打折扣。
Llama API 是 Meta 公开模型的第一方访问点,针对生产用途进行了优化。
借助 Groq 基础架构,开发人员可以获得:
吞吐量高达 625 个令牌/秒
入门难度极小——只需三行代码即可从 OpenAI 迁移
无需冷启动、无需调整、无 GPU 开销
财富 500 强公司和超过 140 万开发人员已经使用 Groq 构建具有速度、可靠性和规模的实时 AI 应用程序。
Llama API 现已可供部分开发人员预览,并计划在未来几周内进行更广泛的推广。
相关推荐

澳大利亚Sharon AI与VAST签订600PB主权AI存储协议
2026-06-16

澳大利亚Swoop与TPG签批发协议以强化自身移动业务
2026-06-16

中国美团孵化Agent社区“觅游”开放全量公测
2026-06-16

阿尔及利亚启动邮政电信行业网络事件响应中心
2026-06-16

德国firstcolo投2.5亿欧元建24MW AI数据中心
2026-06-16

美国SailPoint拟以2亿美元收购以色列AI安全公司Entro
2026-06-16

美国慧与科技(HPE)宣布八家合作伙伴推动混合量子计算
2026-06-16

美国GPU管理公司Hydra Host融资1亿美元
2026-06-16

美国Mavenir获德国5G核心网功能BSI NESAS首张认证
2026-06-16

GNM在美国推出首批入网点,拓展全球骨干网
2026-06-16
最新简讯