JuheNext提供四种型号:
- claude-sonnet-4-5-20250929
- claude-sonnet-4-5-20250929-thinking
经济版本:
- claudecode/claude-sonnet-4-5-20250929
- claudecode/claude-sonnet-4-5-20250929-thinking
关于新模型 Claude Sonnet 4.5 的详细介绍
Anthropic 于 2025 年 9 月 30 日发布了 Claude Sonnet 4.5,官方称其为“全球最佳编程模型”和“迄今为止最强大的模型”。此次发布在 Claude 产品套件的性能、安全性和可用性方面均取得了实质性改进。
1. 主要特性与改进
Claude Sonnet 4.5 在几个关键领域展现了显著的进步:
-
卓越的编程和代理能力:该模型在 SWE-bench Verified 评估中取得了最先进的性能,这是一个衡量实际软件编程能力的基准测试。此外,它能够在复杂的多步骤任务中保持超过 30 小时的专注力。
-
革命性的计算机使用能力:在测试 AI 模型完成真实世界计算机任务的 OSWorld 基准测试中,其得分从四个月前的 42.2%显著跃升至领先的 61.4%。Claude for Chrome 扩展程序已更新,以充分利用这些能力,使模型能够直接导航浏览器、填写电子表格并完成各种任务。
-
强大的推理和数学能力:与之前的模型(包括 Opus 4.1)相比,Sonnet 4.5 在金融、法律、医学和 STEM 等领域的专业知识和推理技能上表现出色。
-
全面的产品升级:
- Claude Code:备受期待的"检查点"功能已为开发者添加,允许他们只需单击即可保存和回滚进度。终端界面也已刷新,并发布了原生的 VS Code 扩展。
- Claude API: 新的上下文编辑和记忆工具已经推出,使代理能够运行更长时间并处理更复杂的任务。
- Claude 应用:该应用现在直接在对话中集成了代码执行和文件创建(电子表格、幻灯片、文档)功能。
-
定价:Claude Sonnet 4.5 的定价与 Sonnet 4 保持不变,输入 token 为每百万个 3 美元,输出 token 为每百万个 15 美元。
2. 安全与对齐
Anthropic 将 Claude Sonnet 4.5 描述为“迄今为止最对齐的前沿模型”。它显著减少了奉承、欺骗、寻求权力和助长妄想等不当行为。该模型在抵御提示词注入攻击方面也取得了重大进展。它在 AI 安全等级 3 (ASL-3) 的保护下发布,其中包括针对化学、生物、放射性和核武器(CBRN)风险的分类器。
3. 开发者工具
除了模型外,Anthropic 还发布了 Claude Agent SDK。这为开发者提供了 Anthropic 用于构建自身产品(如 Claude Code)的核心基础设施,使他们能够为各种任务创建自己的 AI 代理。
4. 研究预览
Anthropic 推出了一个名为“Imagine with Claude”的限时研究预览功能。该功能允许 Claude 实时生成软件,展示了其模型能力与基础设施相结合的可能性。
5. 客户评价
此次发布获得了来自金融、法律、医疗保健、科技(GitHub、Canva、Figma)、安全等领域专家和高管的高度赞誉。这些评价证实了 Sonnet 4.5 在处理复杂任务、代码开发、安全分析和创意设计方面的重大进步。