Anthropic发布Claude Opus 4.6 AI模型,新增智能体团队协作功能
2026-02-06 09:23
收藏

人工智能公司Anthropic近日推出Claude Opus 4.6,这是其Opus系列的最新版本。该AI模型在编程任务处理能力上有明显提升,并首次提供百万令牌的上下文窗口,目前该功能处于测试阶段。Opus 4.6还引入了智能体团队协作机制,允许多个Claude Code实例并行工作以应对复杂挑战。

智能体团队功能是Claude Code的一项核心创新,目前以研究预览形式提供。多个独立的Claude Code实例可以同时运行并相互协调,类似于OpenAI近期推出的Codex应用。一个主导会话负责整体协调、任务分配与结果汇总。团队成员拥有各自的上下文窗口,能直接通信并访问共享任务列表,支持并行处理不同问题。

该功能通过设置环境变量CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1启用。由于每个实例单独计费,使用智能体团队会产生较高的令牌成本,适合需要多角度分析或并行解决方案的复杂协作场景。与智能体团队不同,子代理在单个会话内运作,仅向委托代理返回结果,更适合专注的单一任务。

Opus 4.6还配备了其他新功能:上下文压缩功能可汇总旧信息以释放空间;自适应思考功能能在处理复杂任务时自动延长思考时间;开发者可在四种努力级别中选择以控制计算开销;最大输出长度提升至128,000个令牌。

根据Anthropic公布的基准测试结果,Opus 4.6在多项评估中表现突出:在智能体编程测试Terminal-Bench 2.0中获得最高分;在推理测试Humanity's Last Exam中位居前列;在经济任务评估GDPval-AA测试中,比OpenAI的GPT-5.2高出144个Elo点,比前代Opus 4.5高出190个Elo点。

在处理长上下文方面,Opus 4.6在MRCR v2 8针1M测试中成功率达到76%,而Sonnet 4.5仅为18.5%。BigLaw基准测试给予该模型90.2%的最高分,这是Claude系列迄今取得的最高评分——40%的答案完美,84%的答案评分不低于0.8。

安全性方面,Opus 4.6与其他前沿模型水平相当,错位行为率较低,展现出与Opus 4.5相同的对齐性,但过度拒绝率更低。针对网络安全,Anthropic开发了六个新测试场景,模型符合ASL-3标准。

定价为每百万输入令牌5美元,每百万输出令牌25美元。超过200,000令牌的高级请求,价格分别调整为10美元和37.50美元。未来若推理完全在美国运行,客户需支付10%附加费。2026年2月5日更新说明:补充了OpenAI GPT-5.3 Codex发布的相关信息。

本简讯来自全球互联网及战略合作伙伴信息的编译与转载,仅为读者提供交流,有侵权或其它问题请及时告之,本站将予以修改或删除,未经正式授权严禁转载本文。邮箱:news@wedoany.com