claude-sonnet-4-5-20250929

JuheNext提供四种型号：

claude-sonnet-4-5-20250929
claude-sonnet-4-5-20250929-thinking

经济版本：

claudecode/claude-sonnet-4-5-20250929
claudecode/claude-sonnet-4-5-20250929-thinking

关于新模型 Claude Sonnet 4.5 的详细介绍

Anthropic 于 2025 年 9 月 30 日发布了 Claude Sonnet 4.5，官方称其为“全球最佳编程模型”和“迄今为止最强大的模型”。此次发布在 Claude 产品套件的性能、安全性和可用性方面均取得了实质性改进。

1. 主要特性与改进

Claude Sonnet 4.5 在几个关键领域展现了显著的进步：

卓越的编程和代理能力：该模型在 SWE-bench Verified 评估中取得了最先进的性能，这是一个衡量实际软件编程能力的基准测试。此外，它能够在复杂的多步骤任务中保持超过 30 小时的专注力。
革命性的计算机使用能力：在测试 AI 模型完成真实世界计算机任务的 OSWorld 基准测试中，其得分从四个月前的 42.2%显著跃升至领先的 61.4%。Claude for Chrome 扩展程序已更新，以充分利用这些能力，使模型能够直接导航浏览器、填写电子表格并完成各种任务。
强大的推理和数学能力：与之前的模型（包括 Opus 4.1）相比，Sonnet 4.5 在金融、法律、医学和 STEM 等领域的专业知识和推理技能上表现出色。
全面的产品升级：
- Claude Code：备受期待的"检查点"功能已为开发者添加，允许他们只需单击即可保存和回滚进度。终端界面也已刷新，并发布了原生的 VS Code 扩展。
- Claude API: 新的上下文编辑和记忆工具已经推出，使代理能够运行更长时间并处理更复杂的任务。
- Claude 应用：该应用现在直接在对话中集成了代码执行和文件创建（电子表格、幻灯片、文档）功能。
定价：Claude Sonnet 4.5 的定价与 Sonnet 4 保持不变，输入 token 为每百万个 3 美元，输出 token 为每百万个 15 美元。

2. 安全与对齐

Anthropic 将 Claude Sonnet 4.5 描述为“迄今为止最对齐的前沿模型”。它显著减少了奉承、欺骗、寻求权力和助长妄想等不当行为。该模型在抵御提示词注入攻击方面也取得了重大进展。它在 AI 安全等级 3 (ASL-3) 的保护下发布，其中包括针对化学、生物、放射性和核武器（CBRN）风险的分类器。

3. 开发者工具

除了模型外，Anthropic 还发布了 Claude Agent SDK。这为开发者提供了 Anthropic 用于构建自身产品（如 Claude Code）的核心基础设施，使他们能够为各种任务创建自己的 AI 代理。

4. 研究预览

Anthropic 推出了一个名为“Imagine with Claude”的限时研究预览功能。该功能允许 Claude 实时生成软件，展示了其模型能力与基础设施相结合的可能性。

5. 客户评价

此次发布获得了来自金融、法律、医疗保健、科技（GitHub、Canva、Figma）、安全等领域专家和高管的高度赞誉。这些评价证实了 Sonnet 4.5 在处理复杂任务、代码开发、安全分析和创意设计方面的重大进步。

claude-sonnet-4-5-20250929

模型描述

关于新模型 Claude Sonnet 4.5 的详细介绍