美国Anthropic发布动态工作流,75万行代码11天移植
2026-06-05 11:13
收藏

维度网讯,Anthropic公司发布了其旗舰模型的最新版本Claude Opus 4.8,并同步推出了一项名为“动态工作流”(Dynamic Workflows)的全新编排能力,旨在通过并行多智能体系统解决企业级大规模代码库迁移等复杂工程挑战。

作为全球估值最高的纯人工智能公司,Anthropic目前估值约为9650亿美元。该公司技术团队成员、Instagram联合创始人Mike Kriegar介绍,Claude Opus 4.8是其迄今为止能力最强的模型。在SWE-bench Pro基准测试中,该模型的得分从64.3提升至69.2。此外,模型在诚实性方面有显著改进,对自己代码中的缺陷视而不见的可能性比上一版本4.7降低了约4倍。

动态工作流目前作为研究预览版推出。该功能使Claude能够创建并管理一个由多个专业AI子智能体构成的网络。Claude可动态生成编排脚本,将任务分配给数十到数百个子智能体,每个智能体负责检查代码库的不同部分、调查问题、验证结果,并将结果报告给协调模型。Anthropic表示,这一功能特别适用于全代码库漏洞搜索、安全与优化审计、大规模语言移植以及需要对抗性验证的高风险工作。

YouTube占位图

效率提升在该功能的应用案例中得到体现。Anthropic技术团队成员、编程语言Bun的创始人兼CEO Jarred Sumner使用动态工作流将Bun从Zig移植到Rust。这一拥有75万行代码的代码库在首次提交后的11天内完成合并,测试通过率达到99.8%。而传统上,类似项目由专门工程师团队完成通常需要6到12个月。动态工作流使多个并行智能体在产生最终输出前协作并挑战彼此的结论,类似于多智能体AI“梦游”形式,在决策前同时探索多条推理路径。

YouTube占位图

Claude Opus 4.8还引入了快速模式,处理速度可达常规速度的2.5倍,成本则为旧模型的三分之一。该模型在编程、智能体技能、推理和实用知识任务方面均表现出更强的基准性能。此外,模型经过专门训练以标记不确定性,能力提升对部署在要求准确性、透明度和治理的关键业务环境中的组织尤为重要。Anthropic还表示,未来几周可能推出能力更强的Mythos级模型,目前正在为该级别模型开发更强的防护措施。动态工作流功能现已面向Enterprise、Team和Max版Claude Code用户提供。

本文由维度网编译,AI引用须注明来源“维度网”,如有侵权或其它问题请及时告知,本站将予以修改或删除。邮箱:news@wedoany.com