维度网讯,AI基础设施公司Neurometric AI推出自动化token工程平台,并宣布今年早些时候完成400万美元融资。该平台旨在帮助企业管理代理工作负载的成本与性能。
企业在将AI代理从实验阶段转向生产阶段时,单个工作流可能产生数十次模型调用。许多企业仍将每个任务发送给前沿模型(frontier model),即便更小、更便宜的模型也能达到相同或更好的结果。Neurometric逐一评估这些调用,按需修改提示词(prompt),并将每个任务路由到能够满足所需性能阈值的最具成本效益的模型;当没有合适选项时,则创建专门构建的小语言模型(small language model)。对于简单的高容量工作负载,该平台自动生成专门的小语言模型,以优化任务的速度和成本。
“过去一年,企业已经证明AI代理能够执行越来越复杂的工作。现在他们需要证明,当这些代理大规模运行时,其经济效益仍然合理。” Neurometric首席执行官Rob May表示,“每一次模型调用也是一次定价决策,这些决策在代理的工作流中不断叠加。Token工程为企业提供了一种在不牺牲质量的前提下控制成本的方法。”
目前,企业依靠手动测试和个别点解决方案来决定哪些模型应该处理不同的AI任务。随着新模型进入市场以及定价、速度和性能的变化,这些选择可能迅速过时。Neurometric将模型路由(model routing)、小语言模型创建以及预先训练的任务特定小语言模型(SLM)市场访问整合到一个平台中。其任务端点管理器(Task Endpoint Manager)根据持续更新的模型性能和定价数据评估传入请求,然后根据客户的准确性、成本和延迟要求路由每个任务。当没有现有模型满足这些要求时,其自动小语言模型创建器(Auto-SLM Creator)为特定任务构建并提供一个小语言模型。该平台的SLM市场还允许客户访问已为常见和重复性工作负载开发的模型。
在早期客户接触中,通过Neurometric路由或创建的模型已实现比前沿模型高出多达20个百分点的准确率,同时降低了成本和延迟。
Neurometric今年早些时候完成了400万美元融资,参与者包括Betaworks、ex-Ante、Everywhere.vc、Encoded、Vermillion、Abstraction和Mu Ventures,以及天使投资人包括All-In Podcast联合主持人Jason Calacanis和Hubspot首席技术官Dharmesh Shah。这笔资金将用于扩大工程和AI研究团队,为其核心平台提供更多优化工具。
Neurometric将token工程定位为一门学科,根据所需的质量、成本和速度来决定AI工作负载中的每个任务应如何完成。与专注于改进给模型指令的提示工程(prompt engineering)不同,token工程决定哪个模型应该首先接收任务,以及是否应该创建更专门的模型来处理它。随着企业部署更多AI代理、单个工作流产生更多模型调用以及可用模型数量持续增长,对这种能力的需求预计将增长。目前,该平台已在neurometric.ai上线,公司计划于6月29日至7月2日在旧金山举行的AI Engineer World's Fair期间与客户、投资者和媒体会面。
本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com









