o1-2024-12-17

模型描述

o1 系列模型通过强化学习进行训练,以执行复杂的推理。o1 模型在回答之前会进行思考,在回应用户之前产生一条长的内部思维链。

🔔如何使用

graph LR A("Purchase Now") --> B["Start Chat on Homepage"] A --> D["Read API Documentation"] B --> C["Register / Login"] C --> E["Enter Key"] D --> F["Enter Endpoint & Key"] E --> G("Start Using") F --> G style A fill:#f9f9f9,stroke:#333,stroke-width:1px style B fill:#f9f9f9,stroke:#333,stroke-width:1px style C fill:#f9f9f9,stroke:#333,stroke-width:1px style D fill:#f9f9f9,stroke:#333,stroke-width:1px style E fill:#f9f9f9,stroke:#333,stroke-width:1px style F fill:#f9f9f9,stroke:#333,stroke-width:1px style G fill:#f9f9f9,stroke:#333,stroke-width:1px

点击购买

点击首页立即对话

注册 / 登录

输入key

阅读API文档

输入端点和API Key

开始使用

全文结束

推荐模型

QwQ-32B

QwQ-32B 是 Qwen 系列中的一个 32.5B 参数推理模型,具有先进的架构和 131K 令牌上下文长度,旨在在复杂任务中超越像 DeepSeek-R1 这样的最先进模型。

DeepClaude-3-7-sonnet

DeepSeek-R1 + claude-3-7-sonnet-20250219,Deep 系列由 DeepSeek-R1(671b)模型与其他模型的思维链推理相结合而成,充分利用了 DeepSeek 思维链的强大能力。它采用了一种利用其他更强大模型进行补充的策略,从而增强了整体模型的能力。

DeepSeek-R1

与 OpenAI-o1 相当的性能,完全开源模型和技术报告,代码和模型在 MIT 许可证下发布:自由提炼和商业化。