美国Linux基金会成立Tokenomics Foundation应对AI成本失控
2026-06-06 11:43
收藏

维度网讯,企业正在为日益高昂的AI使用成本而焦虑。Uber在4月份就已耗尽2026年全年的AI编程预算;微软在允许开发者使用Claude Code数月后收回了许可;一位Priceline员工向科技媒体TechCrunch透露,其Cursor常规合同续签费用上涨了4至5倍。

尽管每令牌(token)价格有所下降,但AI应用的普及和日益自主化的代理程序正在推动总消耗量急剧攀升。2025年初大量订阅不限量套餐的公司,如今正忙于查清资金去向、削减开支,并试图从预算压力中找回投资回报率。与此同时,一个满足成本追踪需求的市场正在形成,初创公司、现有供应商以及一个新的标准机构都在竞相为企业提供相关工具和语言体系。

“六个月前,客户只会问‘它能做什么?足够好吗?’”OpenAI企业负责人Alexander Embiricos在纽约市的一个活动上告诉TechCrunch。“现在对话完全不同了,变成了‘我们花了太多钱,你能提供什么可见性?有什么审计能力?有什么令牌控制?你的模型效率如何?’”

在此背景下,Linux基金会本周公布了Tokenomics Foundation计划,这是一个新的标准机构,旨在为AI令牌支出带来类似FinOps(为云支出建立的成本纪律)的管理规范。

“4月和5月,我开始听到公司说:‘天哪,我们已经超支了2026年整个令牌预算的三倍,而这才4月份’”,Linux基金会下属FinOps基金会执行董事J.R. Storment告诉TechCrunch。“我们开始听到存在性危机,整个对话从‘令牌最大化’和‘快跑’转向了‘我们需要护栏,如何控制它?’”

这些呼声出现在CEO们此前狂热要求团队不计成本使用最佳模型、快速推进项目之后。11月发布的新模型,如Anthropic的Claude Opus 4.5、OpenAI的GPT-5.1和Google的Gemini 3 Pro,带来了代理工具的显著改进,使得消耗量成倍增长。据报道,一家公司因忘记为员工设置使用限制,面临了5亿美元的Claude账单。

“这就像快克可卡因泛滥一样”,Priceline的IT财务高级总监Chris Reed说。他指出公司已经开始对某些群体设置令牌限制:“他们让你先尝甜头,让你上瘾,然后你就被它束缚了。”

工程运营平台Faros AI的CEO Vitaly Gordon表示,他最近与一位首席技术官交谈,对方提到:“我的一个工程师上个月在令牌上花了4万美元,我真的不知道是该阻止他,还是该去告诉其他人都像他一样。”

Faros在3月的一项调查发现,在2万名开发者中,产出在增加,但bug和重写也在增加。工程管理平台Jellyfish同样发现,使用令牌最多的工程师的生产力大约是较少使用AI的工程师的两倍,但他们为此花费的令牌数量是后者的10倍。

Jellyfish的研究主管Nicholas Arcolano通过电子邮件告诉TechCrunch,AI支出爆炸式增长很大程度上是由于代理功能,每位开发者的消费在9个月内增长了约18.6倍。这些数据使得生产力提升与支出增长之间的对应关系变得更加模糊。“极端支出是否划算,最终取决于所发布代码的最终商业价值(例如收入),而大多数公司仍然无法衡量这一点”,Arcolano说。

部分衡量问题在于当前AI的使用规模之大。“追踪云成本是一个每月数亿行的数据问题”,Storment说。“追踪令牌成本是一个每月数万亿行的数据问题。你不能简单地把数据塞进任何电子表格甚至基本工具里。你必须从根本上重新思考你的工具、规范和会计系统。”

在Priceline,Reed已经看到了差异,他指出供应商报告的使用量与Priceline内部数据之间存在问题。“我的职业生涯从电信费用管理开始,我看到了从电信到云再到AI的所有相似之处”,他说。“每当引入新东西时,就容易出现计费错误以及审计和优化的机会。”

围绕这个问题,一个市场正在形成。纯玩家公司如Pay-i可以追踪、衡量和优化GenAI投资的成本和性能;Paid则让开发者追踪成本、衡量使用情况,并根据实际价值而非订阅费向用户收费。还有Jellyfish、Waydev和Faros AI等公司,提供AI代理监控以证明开发者工具的投资回报率。Storment表示,FinOps Foundation旗下的180家供应商中的大多数都倾向于这个领域。

拥有现有分销渠道的公司也在增加新功能。Ramp最近进入了AI支出管理领域;Datadog和New Relic增加了云成本管理、令牌级可观测性和GPU监控等服务。在下周的FinOps X大会上,AWS预计将推出面向企业AI支出的新财务管理功能。

NEA合伙人Tiffany Luck认为,令牌效率和可观测性可能会被添加到“harness层或应用层”。她提到初创公司Factory,该公司本周推出了一款模型路由器,可自动为每个任务选择合适的模型。Gordon预计,前沿实验室和其他模型提供商将采用OpenRouter式的优化,将查询导向最便宜的模型——这一趋势已在企业的Claude账单上显现。“即使你调用的是Opus模型,部分费用也会归于Sonnet或Haiku”,Gordon说,“因为后者足够智能来完成此项工作。我认为这将变得越来越普遍。”

然而,所有这些工具都是在没有通用语言或共享定义的情况下构建的。这正是Tokenomics Foundation希望发挥作用的地方。该基金会正在为“tokenomics”构建规范定义和框架;制定AI令牌使用和计费的开放标准、规范和指标;以及制定如每智能成本或每瓦特令牌数等新指标。它还计划定义令牌工厂效率和消耗效率的指标。该组织计划于7月正式启动,并将在下周的FinOps X大会上宣布更多成员。

“令牌经济从根本上比我们以前在这个规模上管理的任何东西都更抽象和不透明”,Salesforce首席可用性官Nishant Gupta在一份声明中说。“它需要一种不同于行业为云所建立的操作肌肉。”

尽管高盛预测到2030年全球令牌使用量将增长24倍,但已经超预算的企业现在就需要解决方案,而该基金会的第一个交付成果还要几个月才能出来。“也许我们发明了蒸汽机,但我们还没有搞清楚流水线”,Gordon说。根据Arcolano的说法,明智的做法是广泛而适度地采用。“最佳的投资回报率来自将广泛的中间层从低使用率提升到中等使用率,而不是推动重度用户更高”,他说。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com