Anthropic发布Claude Opus 4.6 AI模型，新增智能体团队协作功能

2026-02-06 09:23

关键词:

人工智能公司Anthropic近日推出Claude Opus 4.6，这是其Opus系列的最新版本。该AI模型在编程任务处理能力上有明显提升，并首次提供百万令牌的上下文窗口，目前该功能处于测试阶段。Opus 4.6还引入了智能体团队协作机制，允许多个Claude Code实例并行工作以应对复杂挑战。

智能体团队功能是Claude Code的一项核心创新，目前以研究预览形式提供。多个独立的Claude Code实例可以同时运行并相互协调，类似于OpenAI近期推出的Codex应用。一个主导会话负责整体协调、任务分配与结果汇总。团队成员拥有各自的上下文窗口，能直接通信并访问共享任务列表，支持并行处理不同问题。

该功能通过设置环境变量CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1启用。由于每个实例单独计费，使用智能体团队会产生较高的令牌成本，适合需要多角度分析或并行解决方案的复杂协作场景。与智能体团队不同，子代理在单个会话内运作，仅向委托代理返回结果，更适合专注的单一任务。

Opus 4.6还配备了其他新功能：上下文压缩功能可汇总旧信息以释放空间；自适应思考功能能在处理复杂任务时自动延长思考时间；开发者可在四种努力级别中选择以控制计算开销；最大输出长度提升至128,000个令牌。

根据Anthropic公布的基准测试结果，Opus 4.6在多项评估中表现突出：在智能体编程测试Terminal-Bench 2.0中获得最高分；在推理测试Humanity's Last Exam中位居前列；在经济任务评估GDPval-AA测试中，比OpenAI的GPT-5.2高出144个Elo点，比前代Opus 4.5高出190个Elo点。

在处理长上下文方面，Opus 4.6在MRCR v2 8针1M测试中成功率达到76%，而Sonnet 4.5仅为18.5%。BigLaw基准测试给予该模型90.2%的最高分，这是Claude系列迄今取得的最高评分——40%的答案完美，84%的答案评分不低于0.8。

安全性方面，Opus 4.6与其他前沿模型水平相当，错位行为率较低，展现出与Opus 4.5相同的对齐性，但过度拒绝率更低。针对网络安全，Anthropic开发了六个新测试场景，模型符合ASL-3标准。

定价为每百万输入令牌5美元，每百万输出令牌25美元。超过200,000令牌的高级请求，价格分别调整为10美元和37.50美元。未来若推理完全在美国运行，客户需支付10%附加费。2026年2月5日更新说明：补充了OpenAI GPT-5.3 Codex发布的相关信息。

美国