韩国软件企业多技术组合应对AI智能体token成本激增

2026-07-02 08:56

关键词:

维度网讯，韩国软件企业正通过组合提示词优化、LLM网关、本地部署及多模型策略等多种技术，降低AI智能体普及带来的代币成本急剧攀升问题。

[图片来源:nanobanana2生成]

AI智能体为完成任务会多次自行调用语言模型并执行多种工具，导致代币消耗量比人类使用时激增数倍至数十倍。韩国一企业自今年起在全公司部署AI智能体，月均消耗约2500亿代币，每月产生2亿至3亿韩元的基础设施成本。

部分企业从提示词轻量化和缓存入手，WISEITECH减少不必要的长输入和重复调用，Naver Cloud根据任务优化模型。企业正将LLM网关视为核心控制节点，实时监控各部门的模型使用情况，Hancom整合路由和回退体系，NDS基于LiteLLM构建网关。

本地部署方案也被多家企业采用，MakinaRocks将开源模型与自有vLLM基础设施对接，S2W利用自建GPU服务器处理大容量任务。多模型组合策略将标准化重复任务交由轻量或开源模型处理，Crowdworks通过Amazon Bedrock等商业模型与迷你模型配合使用。CyNapse Soft引入Serena MCP和LSP技术，将源代码按语义单元分割，与开源框架相比实现了约20%的代币节省效果。

生成式AI时代的成本优化考验企业的架构设计能力。通过缓存剔除重复请求、本地部署隔离敏感数据、路由替换高成本模型，构建综合控制体系将成为区分软件企业持续性的标尺。

韩国