阿联酋FAR Labs开放AI推理平台,部分模型定价低91%
2026-06-27 11:23
收藏

维度网讯,FAR Labs 宣布开放其 FAR AI 推理平台的注册,允许开发者访问,并公布了多个模型部署的标价。这家总部位于阿布扎比的人工智能基础设施企业(隶属于 Dizzaract)旨在帮助开发者在软件产品和自动化工具使用量增长时,降低 AI 应用的运行成本。

FAR Labs 开放更便宜的人工智能推理平台访问权限

该平台的核心是一个分布式推理网络,能够将构建者的需求与可用的计算资源进行匹配。用户可通过一个兼容 OpenAI 的 API 访问系统,从多个模型中选择并快速启动,其工作负载则由 FAR Orchestrator 路由至 GPU 资源上执行。FAR Labs 将成本作为其主要竞争优势,该公司通过与其他提供商标价的基准比较声称,其网络结构使其能够在某些部署上提供显著更低的价格。

具体而言,对于 Qwen3-30B-A3B 模型,FAR AI 的标价为每 100 万 token 0.03 美元,而 NextBit 为 0.35 美元,DeepInfra 为 0.27 美元。该公司称,这一定价比后者低了最多 91%。对于 Qwen2.5-72B-Instruct 模型,该公司列出的 FP8 标价为每 100 万 token 0.17 美元,而 NovitaAI BF16 为 0.39 美元,DeepInfra FP8 为 0.38 美元。据称,这使其定价比所列的替代方案低 55% 到 56%。对于 Qwen3.5-122B-A10B 模型,FAR AI 列出的 FP8 标价为每 100 万 token 0.51 美元。根据该公司的说法,与 AtlasCloud FP8 和 SiliconFlow FP8 等提供商相比,输出 token 成本降低了最多 79%。

FAR Labs 此举正值 AI 公司面临与早年不同的经济挑战。尽管 token 单价大幅下降,但随着企业通过客户支持工具、智能体、助手、游戏和内部工作流程推送更多 AI 请求,推理的总支出仍在持续上升。对依赖 OpenAI 和 Anthropic 等公司专有 API 的开发者而言,这一转变尤为重要。随着产品规模化,重复的推理费用可能压缩利润,并限制测试和扩展空间。

FAR Labs 表示,其定价优势来自于利用未充分利用的计算资源,而非依赖大型专用数据中心集群。该平台使用来自消费设备以及中小企业数据中心的可用 GPU 容量,并通过其以性能为核心的编排层分配工作。公司还试图解决价格之外的问题,称运行生产工作负载的构建者需要私密、路由可靠、低延迟且可用于实际场景的系统。其编排层包括基于可信执行环境的安全推理、可靠性评分、对开源和专有模型的支持,以及语义向量流。据 FAR Labs 称,路由系统围绕正常运行时间、工作负载连续性和延迟敏感性能而设计。

该公司表示,在 SuperAI Singapore 会议期间,与开发者、GPU 供应商、模型团队、投资者和企业高管的多次谈话中都提及了对这类基础设施的兴趣,指向了对更快、更可靠、更低成本且可用于生产环境的推理基础设施的需求。FAR AI 目前正处于与封闭合作伙伴的测试阶段,并向构建者提供早期访问注册,为加入计划者提供 100 万免费 token。

在一份声明中,Dizzaract 创始人兼首席执行官 Ilman Shazhaev 阐述了公司的市场理由。“AI 的价格不断下降。自 2021 年以来,每 token 成本下降了约 99%。然而,AI 账单却在不断上涨,因为使用量的增长速度快于价格下降的速度。推理正成为 AI 中最大的单一成本,”他表示。“我们的成本优势不是我们在烧钱的折扣。它是结构性的。”

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com