qwen3-32b

2025-04-28
对话, 推理
By Qwen

Input: ￥2.00 / M tokens Output: ￥20.00 / M tokens
特征：推理, 流式, 文本输入, 文本输出
上下文： 128K
最大输出： 8K

Input: ￥2.00 / M tokens Output: ￥20.00 / M tokens
特征：推理, 流式, 文本输入, 文本输出
上下文： 128K
最大输出： 8K

Qwen3-32B 代表了 Qwen 系列大型语言模型的最新进展，提供了一种经过精心训练的密集架构，以实现突破性的性能。Qwen3 模型因其在单一框架内无缝切换思维模式（复杂逻辑推理、数学和编码）和非思维模式（高效、通用对话）而受到认可，确保在多种场景下的最佳性能。

关键亮点：

在数学、代码生成和常识逻辑推理方面超越了之前的 QwQ 和 Qwen2.5 指令模型。
展现出与人类偏好的优越对齐，在创意写作、角色扮演、多轮对话和指令跟随方面表现出色，实现高度引人入胜和自然的互动。
展示了先进的代理能力，能够在思考和非思考模式下准确集成外部工具，在复杂的基于代理的任务中实现领先表现。
提供强大的多语言支持，覆盖超过 100 种语言和方言，具备可靠的指令跟随和翻译能力。
模型概述：

特征	描述
类型	因果语言模型
训练阶段	预训练与后训练
参数数量	32.8B
非嵌入参数	31.2B
图层	64
注意力头（GQA）	Q: 64, KV: 8
上下文长度	128K

Qwen3-32B 在推理、代理功能、对话质量和多语言支持方面为大型语言模型设定了新的基准，使其成为各种高级人工智能应用的理想解决方案。

🔔如何使用

graph LR A("Purchase Now") --> B["Start Chat on Homepage"] A --> D["Read API Documentation"] B --> C["Register / Login"] C --> E["Enter Key"] D --> F["Enter Endpoint & Key"] E --> G("Start Using") F --> G style A fill:#f9f9f9,stroke:#333,stroke-width:1px style B fill:#f9f9f9,stroke:#333,stroke-width:1px style C fill:#f9f9f9,stroke:#333,stroke-width:1px style D fill:#f9f9f9,stroke:#333,stroke-width:1px style E fill:#f9f9f9,stroke:#333,stroke-width:1px style F fill:#f9f9f9,stroke:#333,stroke-width:1px style G fill:#f9f9f9,stroke:#333,stroke-width:1px

qwen3-32b

模型描述