whisper-1

模型描述

Whisper 是一个通用的语音识别模型,训练于一个大型多样化音频数据集。您还可以将其用作多任务模型,以执行多语言语音识别、语音翻译和语言识别。

🔔如何使用

graph LR A("Purchase Now") --> B["Start Chat on Homepage"] A --> D["Read API Documentation"] B --> C["Register / Login"] C --> E["Enter Key"] D --> F["Enter Endpoint & Key"] E --> G("Start Using") F --> G style A fill:#f9f9f9,stroke:#333,stroke-width:1px style B fill:#f9f9f9,stroke:#333,stroke-width:1px style C fill:#f9f9f9,stroke:#333,stroke-width:1px style D fill:#f9f9f9,stroke:#333,stroke-width:1px style E fill:#f9f9f9,stroke:#333,stroke-width:1px style F fill:#f9f9f9,stroke:#333,stroke-width:1px style G fill:#f9f9f9,stroke:#333,stroke-width:1px

点击购买

点击首页立即对话

注册 / 登录

输入key

阅读API文档

输入端点和API Key

开始使用

全文结束

推荐模型

claude-3-5-sonnet-20241022-rev

使用逆向工程在官方应用程序中调用模型并将其转换为 API。

claude-sonnet-4-6

Claude Sonnet 4.6 是一款多功能升级,提供与 Opus 同级别的智能,涵盖编码、计算机使用和长上下文推理,拥有 100 万令牌的上下文窗口,同时保持现有价格水平。

gemini-2.5-flash-image-preview-bs(nano-banana)

Gemini 2.5 Flash Image 是一种最先进的图像生成和编辑模型,提供字符一致性、基于自然语言的转换、多图像融合以及 Gemini 世界知识的集成等高级功能。