Meta 与 Groq 携手快速 AI 推理,提升 Llama API 性能
人工智能推理领域的领导者 Groq 宣布与 Meta 合作,为官方 Llama API 提供快速推理功能,为开发人员提供运行最新 Llama 模型的最快、最具成本效益的方式。

现已推出预览版的 Llama 4 API 模型,由 Groq 加速,将在全球最高效的推理芯片 Groq LPU 上运行。这意味着开发者可以运行 Llama 模型,无需任何权衡:低成本、快速响应、可预测的低延迟以及针对生产工作负载的可靠扩展。
Groq 和 Meta 宣布以最快、成本最低的方式运行世界上最值得信赖的公开模型。
与通用 GPU 堆栈不同,Groq 垂直集成,只用于一项任务:推理。越来越多的构建者转向 Groq,因为从定制芯片到云交付,每一层都经过精心设计,旨在提供一致的速度和成本效益,且不打折扣。
Llama API 是 Meta 公开模型的第一方访问点,针对生产用途进行了优化。
借助 Groq 基础架构,开发人员可以获得:
吞吐量高达 625 个令牌/秒
入门难度极小——只需三行代码即可从 OpenAI 迁移
无需冷启动、无需调整、无 GPU 开销
财富 500 强公司和超过 140 万开发人员已经使用 Groq 构建具有速度、可靠性和规模的实时 AI 应用程序。
Llama API 现已可供部分开发人员预览,并计划在未来几周内进行更广泛的推广。
相关推荐

美国博通推出大众市场10G PON与Wi-Fi 8芯片方案,助力千兆宽带规模化部署
2026-05-02
芬兰诺基亚FWA业务出售给美国Inseego
2026-05-02

新加坡PDG宣布建设印尼JC4超大规模数据中心园区,规划容量240兆瓦
2026-05-02

瑞典爱立信获哥斯达黎加ICE 5G合同
2026-05-02

荷兰Veon在乌克兰投资增至13亿美元 超额完成承诺
2026-05-02

美国AOS推出SmartClamp DrMOS系列,用于AI服务器
2026-05-02

美国Ubiquiti发布机架式网关UDM-Beast,搭载8核Arm处理器14网口,定价1499美元
2026-05-02

SpaceX星舰投资逾150亿美元
2026-05-02

三星转向AI转型,推动硅光子与内存业务增长
2026-05-02

美国Zayo完成42.5亿美元收购Crown Castle光纤业务
2026-05-02
最新简讯
1
美国博通推出大众市场10G PON与Wi-Fi 8芯片方案,助力千兆宽带规模化部署
2
芬兰诺基亚FWA业务出售给美国Inseego
3
新加坡PDG宣布建设印尼JC4超大规模数据中心园区,规划容量240兆瓦
4
瑞典爱立信获哥斯达黎加ICE 5G合同
5
荷兰Veon在乌克兰投资增至13亿美元 超额完成承诺
6
美国AOS推出SmartClamp DrMOS系列,用于AI服务器
7
美国Ubiquiti发布机架式网关UDM-Beast,搭载8核Arm处理器14网口,定价1499美元
8
SpaceX星舰投资逾150亿美元
9
三星转向AI转型,推动硅光子与内存业务增长
10
美国Zayo完成42.5亿美元收购Crown Castle光纤业务
