qwen3-235b-a22b

2025-04-28
对话, 推理
By Qwen

Input: ￥4.00 / M tokens Output: ￥40.00 / M tokens
特征：推理, 流式, 文本输入, 文本输出
上下文： 128K
最大输出： 8K

Input: ￥4.00 / M tokens Output: ￥40.00 / M tokens
特征：推理, 流式, 文本输入, 文本输出
上下文： 128K
最大输出： 8K

模型描述

Qwen3-235B-A22B，作为前沿的 Qwen3 系列的一部分，引入了下一代大型语言模型，具有密集和专家混合（MoE）架构。该先进模型能够在单一模型内无缝切换思考模式（用于复杂推理、数学和编码）和非思考模式（用于快速、通用对话）——为广泛的应用提供最佳性能。

关键亮点：

在思维模式下超越了前一代 QwQ 模型和在非思维模式下的 Qwen2.5 指令模型，在数学、代码生成和常识逻辑推理方面表现优异。
提供与人类偏好的卓越对齐，在创意写作、角色扮演、多轮对话以及遵循指令方面表现出色，能够进行高度自然和引人入胜的对话。
卓越的代理能力允许在思维和非思维模式下精确集成外部工具，在复杂的基于代理的任务中实现开源模型的 SOTA（最先进）性能。
支持超过 100 种语言和方言，具备强大的多语言指令遵循和翻译能力。

模型概述：

特征	描述
类型	因果语言模型
训练阶段	预训练与后训练
参数数量（总计）	235B
激活参数	22B
非嵌入参数	234B
图层	94
注意力头（GQA）	Q: 64, KV: 4
专家数量	128
激活专家	8
上下文长度	128K

Qwen3-235B-A22B 在推理、代理能力、人类对话和多语言支持方面为行业设定了新的标准，使其成为复杂 AI 应用的理想选择。

🔔如何使用

graph LR A("Purchase Now") --> B["Start Chat on Homepage"] A --> D["Read API Documentation"] B --> C["Register / Login"] C --> E["Enter Key"] D --> F["Enter Endpoint & Key"] E --> G("Start Using") F --> G style A fill:#f9f9f9,stroke:#333,stroke-width:1px style B fill:#f9f9f9,stroke:#333,stroke-width:1px style C fill:#f9f9f9,stroke:#333,stroke-width:1px style D fill:#f9f9f9,stroke:#333,stroke-width:1px style E fill:#f9f9f9,stroke:#333,stroke-width:1px style F fill:#f9f9f9,stroke:#333,stroke-width:1px style G fill:#f9f9f9,stroke:#333,stroke-width:1px

点击购买

点击首页立即对话

注册 / 登录

输入key

阅读API文档

输入端点和API Key

开始使用

推荐模型

az/claude-sonnet-4-20250514

对话, 推理, 识图
Anthropic

微软azure平台提供的克劳德模型系列，稳定性适中，价格极低，更适合对稳定性要求不是特别严谨的数据批处理任务。

2025-07-02

75% off

claude-opus-4-20250514-thinking

对话, 推理, 识图
Anthropic

全面介绍 Anthropic 新发布的 Claude 4 模型——Opus 4 和 Sonnet 4，重点突出其功能、性能基准、应用场景、定价及可用性。本报告总结了各模型之间的主要差异，并讨论了它们与 GitHub Copilot 等主流平台的集成，强调了其在编程、高级推理和伦理 AI 响应方面的优势。

2025-05-14

claude-sonnet-4-20250514

对话, 推理, 识图
Anthropic

全面介绍 Anthropic 新发布的 Claude 4 模型——Opus 4 和 Sonnet 4，重点突出其功能、性能基准、应用场景、定价及可用性。本报告总结了各模型之间的主要差异，并讨论了它们与 GitHub Copilot 等主流平台的集成，强调了其在编程、高级推理和伦理 AI 响应方面的优势。

2025-05-14