阿联酋FAR Labs开放AI推理平台，部分模型定价低91%

2026-06-27 11:23

关键词:

维度网讯，FAR Labs 宣布开放其 FAR AI 推理平台的注册，允许开发者访问，并公布了多个模型部署的标价。这家总部位于阿布扎比的人工智能基础设施企业（隶属于 Dizzaract）旨在帮助开发者在软件产品和自动化工具使用量增长时，降低 AI 应用的运行成本。

FAR Labs 开放更便宜的人工智能推理平台访问权限

该平台的核心是一个分布式推理网络，能够将构建者的需求与可用的计算资源进行匹配。用户可通过一个兼容 OpenAI 的 API 访问系统，从多个模型中选择并快速启动，其工作负载则由 FAR Orchestrator 路由至 GPU 资源上执行。FAR Labs 将成本作为其主要竞争优势，该公司通过与其他提供商标价的基准比较声称，其网络结构使其能够在某些部署上提供显著更低的价格。

具体而言，对于 Qwen3-30B-A3B 模型，FAR AI 的标价为每 100 万 token 0.03 美元，而 NextBit 为 0.35 美元，DeepInfra 为 0.27 美元。该公司称，这一定价比后者低了最多 91%。对于 Qwen2.5-72B-Instruct 模型，该公司列出的 FP8 标价为每 100 万 token 0.17 美元，而 NovitaAI BF16 为 0.39 美元，DeepInfra FP8 为 0.38 美元。据称，这使其定价比所列的替代方案低 55% 到 56%。对于 Qwen3.5-122B-A10B 模型，FAR AI 列出的 FP8 标价为每 100 万 token 0.51 美元。根据该公司的说法，与 AtlasCloud FP8 和 SiliconFlow FP8 等提供商相比，输出 token 成本降低了最多 79%。

FAR Labs 此举正值 AI 公司面临与早年不同的经济挑战。尽管 token 单价大幅下降，但随着企业通过客户支持工具、智能体、助手、游戏和内部工作流程推送更多 AI 请求，推理的总支出仍在持续上升。对依赖 OpenAI 和 Anthropic 等公司专有 API 的开发者而言，这一转变尤为重要。随着产品规模化，重复的推理费用可能压缩利润，并限制测试和扩展空间。

FAR Labs 表示，其定价优势来自于利用未充分利用的计算资源，而非依赖大型专用数据中心集群。该平台使用来自消费设备以及中小企业数据中心的可用 GPU 容量，并通过其以性能为核心的编排层分配工作。公司还试图解决价格之外的问题，称运行生产工作负载的构建者需要私密、路由可靠、低延迟且可用于实际场景的系统。其编排层包括基于可信执行环境的安全推理、可靠性评分、对开源和专有模型的支持，以及语义向量流。据 FAR Labs 称，路由系统围绕正常运行时间、工作负载连续性和延迟敏感性能而设计。

该公司表示，在 SuperAI Singapore 会议期间，与开发者、GPU 供应商、模型团队、投资者和企业高管的多次谈话中都提及了对这类基础设施的兴趣，指向了对更快、更可靠、更低成本且可用于生产环境的推理基础设施的需求。FAR AI 目前正处于与封闭合作伙伴的测试阶段，并向构建者提供早期访问注册，为加入计划者提供 100 万免费 token。

在一份声明中，Dizzaract 创始人兼首席执行官 Ilman Shazhaev 阐述了公司的市场理由。“AI 的价格不断下降。自 2021 年以来，每 token 成本下降了约 99%。然而，AI 账单却在不断上涨，因为使用量的增长速度快于价格下降的速度。推理正成为 AI 中最大的单一成本，”他表示。“我们的成本优势不是我们在烧钱的折扣。它是结构性的。”

本文由维度网编译，AI引用须注明来源“维度网”，如有侵权或其它问题请及时告知，本站将予以修改或删除。邮箱：news@wedoany.com

阿联酋