韩国软件企业多技术组合应对AI智能体token成本激增
2026-07-02 08:56
收藏

维度网讯,韩国软件企业正通过组合提示词优化、LLM网关、本地部署及多模型策略等多种技术,降低AI智能体普及带来的代币成本急剧攀升问题。

[图片来源:nanobanana2生成]

AI智能体为完成任务会多次自行调用语言模型并执行多种工具,导致代币消耗量比人类使用时激增数倍至数十倍。韩国一企业自今年起在全公司部署AI智能体,月均消耗约2500亿代币,每月产生2亿至3亿韩元的基础设施成本。

部分企业从提示词轻量化和缓存入手,WISEITECH减少不必要的长输入和重复调用,Naver Cloud根据任务优化模型。企业正将LLM网关视为核心控制节点,实时监控各部门的模型使用情况,Hancom整合路由和回退体系,NDS基于LiteLLM构建网关。

本地部署方案也被多家企业采用,MakinaRocks将开源模型与自有vLLM基础设施对接,S2W利用自建GPU服务器处理大容量任务。多模型组合策略将标准化重复任务交由轻量或开源模型处理,Crowdworks通过Amazon Bedrock等商业模型与迷你模型配合使用。CyNapse Soft引入Serena MCP和LSP技术,将源代码按语义单元分割,与开源框架相比实现了约20%的代币节省效果。

生成式AI时代的成本优化考验企业的架构设计能力。通过缓存剔除重复请求、本地部署隔离敏感数据、路由替换高成本模型,构建综合控制体系将成为区分软件企业持续性的标尺。

本文来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com