claude-3-5-sonnet-20241022

模型描述

Claude 3.5 Sonnet 升级在各项基准测试中带来了显著提升,尤其是在编程和代理任务方面。它在 SWE-bench Verified 上取得了 49.0% 的成绩(此前为 33.4%),超越了所有公开可用的模型,包括专门的编程代理。在工具使用方面也表现出色,在 TAU-bench 的零售领域得分为 69.2%,航空领域为 46.0%。一项重大创新是其计算机使用测试版,使 Claude 能够导航用户界面、点击、输入并自动化工作流程——尽管仍处于实验阶段。Replit 和 GitLab 等早期采用者报告称,在多步编程任务中推理和效率提升了 10%。安全性仍然是重中之重,美国和英国人工智能安全研究院的联合测试确认其符合 ASL-2 风险标准。

🔔如何使用

graph LR A("Purchase Now") --> B["Start Chat on Homepage"] A --> D["Read API Documentation"] B --> C["Register / Login"] C --> E["Enter Key"] D --> F["Enter Endpoint & Key"] E --> G("Start Using") F --> G style A fill:#f9f9f9,stroke:#333,stroke-width:1px style B fill:#f9f9f9,stroke:#333,stroke-width:1px style C fill:#f9f9f9,stroke:#333,stroke-width:1px style D fill:#f9f9f9,stroke:#333,stroke-width:1px style E fill:#f9f9f9,stroke:#333,stroke-width:1px style F fill:#f9f9f9,stroke:#333,stroke-width:1px style G fill:#f9f9f9,stroke:#333,stroke-width:1px

点击购买

点击首页立即对话

注册 / 登录

输入key

阅读API文档

输入端点和API Key

开始使用

全文结束

推荐模型

gemini-3-pro-preview

Gemini 3 是谷歌迄今为止最强大的模型系列,专为高级推理、自主编码和复杂多模态任务而设计,能够对思考深度、延迟和视觉保真度进行细粒度控制。

gemini-2.5-pro

Gemini 2.5 Pro 是 Google 最先进的 AI 模型,专为编码和复杂任务设计,具有增强的推理能力、原生多模态支持以及 100 万 token 的上下文窗口。

o3-mini

o3-mini 是我们最新的小型推理模型,在与 o1-mini 相同的成本和延迟目标下提供高智能。o3-mini 支持关键开发者功能,如结构化输出、函数调用和批量 API。