韩国软件企业多技术组合应对AI智能体token成本激增
维度网讯,韩国软件企业正通过组合提示词优化、LLM网关、本地部署及多模型策略等多种技术,降低AI智能体普及带来的代币成本急剧攀升问题。
![[图片来源:nanobanana2生成]](https://img.wedoany.com/2026/0702/20260702085636297.png)
AI智能体为完成任务会多次自行调用语言模型并执行多种工具,导致代币消耗量比人类使用时激增数倍至数十倍。韩国一企业自今年起在全公司部署AI智能体,月均消耗约2500亿代币,每月产生2亿至3亿韩元的基础设施成本。
部分企业从提示词轻量化和缓存入手,WISEITECH减少不必要的长输入和重复调用,Naver Cloud根据任务优化模型。企业正将LLM网关视为核心控制节点,实时监控各部门的模型使用情况,Hancom整合路由和回退体系,NDS基于LiteLLM构建网关。
本地部署方案也被多家企业采用,MakinaRocks将开源模型与自有vLLM基础设施对接,S2W利用自建GPU服务器处理大容量任务。多模型组合策略将标准化重复任务交由轻量或开源模型处理,Crowdworks通过Amazon Bedrock等商业模型与迷你模型配合使用。CyNapse Soft引入Serena MCP和LSP技术,将源代码按语义单元分割,与开源框架相比实现了约20%的代币节省效果。
生成式AI时代的成本优化考验企业的架构设计能力。通过缓存剔除重复请求、本地部署隔离敏感数据、路由替换高成本模型,构建综合控制体系将成为区分软件企业持续性的标尺。
本文来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com
相关推荐

日本投入1万亿日元开发AI基础模型
2026-07-02

中国维安电子IPO申请获受理,拟募资18.35亿元
2026-07-02

葡萄牙发布90亿参数大语言模型AMÁLIA
2026-07-02

美国ULA拟于7月2日发射29颗亚马逊Leo卫星
2026-07-02

美国安森美推出ARX383CS VGA图像传感器
2026-07-02

英国MDOTM融资2700万美元
2026-07-02

美国Pie获1950万美元A轮融资,助小企业适应AI搜索
2026-07-02

比利时Aikido收购以色列Root,交易额或达1亿美元
2026-07-02

法国电信财团将SFR收购报价提高至204亿欧元
2026-07-02

美国Upscale AI累计融资5亿美元押注AI网络
2026-07-02