claude-opus-4-1-20250805

模型描述

今天我们发布了 Claude Opus 4.1,这是 Claude Opus 4 在代理任务、实际编码和推理方面的升级。我们计划在未来几周内发布对模型进行的大幅改进。

您可以使用以下模型版本:

  • claude-opus-4-1-20250805
  • claude-opus-4-1-20250805-thinking

ClaudeCode 折扣模型 (八折优惠):

  • claudecode/claude-opus-4-1-20250805
  • claodecode/claude-opus-4-1-20250805-thinking

Opus 4.1 将我们最先进的编码性能在 SWE-bench Verified 上提升至 74.5%。它还提升了 Claude 的深入研究和数据分析能力,尤其是在细节追踪和自主搜索方面。

Chart showing Claude's progress on a popular coding evaluation

GitHub 指出,Claude Opus 4.1 在大多数能力上相对于 Opus 4 有所提升,尤其在多文件代码重构方面有显著的性能提升。乐天集团 发现,Opus 4.1 擅长在大型代码库中精准定位修正,而不会进行不必要的调整或引入错误,他们的团队更倾向于这种精确性来处理日常调试任务。Windsurf 报告称,Opus 4.1 在其初级开发者基准测试中,相对于 Opus 4 实现了 1 个标准差的提升,表现出与从 Sonnet 3.7 到 Sonnet 4 的飞跃大致相同的性能提升。

A benchmark table comparing Claude Opus 4.1 to prior Claude models and other public models

🔔如何使用

graph LR A("Purchase Now") --> B["Start Chat on Homepage"] A --> D["Read API Documentation"] B --> C["Register / Login"] C --> E["Enter Key"] D --> F["Enter Endpoint & Key"] E --> G("Start Using") F --> G style A fill:#f9f9f9,stroke:#333,stroke-width:1px style B fill:#f9f9f9,stroke:#333,stroke-width:1px style C fill:#f9f9f9,stroke:#333,stroke-width:1px style D fill:#f9f9f9,stroke:#333,stroke-width:1px style E fill:#f9f9f9,stroke:#333,stroke-width:1px style F fill:#f9f9f9,stroke:#333,stroke-width:1px style G fill:#f9f9f9,stroke:#333,stroke-width:1px

点击购买

点击首页立即对话

注册 / 登录

输入key

阅读API文档

输入端点和API Key

开始使用

全文结束

推荐模型

claude-opus-4-20250514

全面介绍 Anthropic 新发布的 Claude 4 模型——Opus 4 和 Sonnet 4,重点突出其功能、性能基准、应用场景、定价及可用性。本报告总结了各模型之间的主要差异,并讨论了它们与 GitHub Copilot 等主流平台的集成,强调了其在编程、高级推理和伦理 AI 响应方面的优势。

DeepGemini-2.5-pro

DeepSeek-R1 + gemini-2.5-pro-preview-03-25,Deep 系列由 DeepSeek-R1(671b)模型与其他模型的思维链推理相结合,充分利用 DeepSeek 思维链的强大能力。它采用利用其他更强大模型进行补充的策略,从而增强整体模型的能力。

claude-opus-4-1-20250805

Opus 4.1 将我们最先进的编码性能提升至 SWE-bench Verified 上的 74.5%。它还提升了 Claude 的深度研究和数据分析能力,尤其是在细节追踪和自主搜索方面。