gpt-4o-transcribe

模型描述

GPT-4o 转录是一个语音转文本模型,使用 GPT-4o 来转录音频。与原始 Whisper 模型相比,它在单词错误率和语言识别及准确性方面有所改善。使用它可以获得更准确的转录。

🔔如何使用

graph LR A("Purchase Now") --> B["Start Chat on Homepage"] A --> D["Read API Documentation"] B --> C["Register / Login"] C --> E["Enter Key"] D --> F["Enter Endpoint & Key"] E --> G("Start Using") F --> G style A fill:#f9f9f9,stroke:#333,stroke-width:1px style B fill:#f9f9f9,stroke:#333,stroke-width:1px style C fill:#f9f9f9,stroke:#333,stroke-width:1px style D fill:#f9f9f9,stroke:#333,stroke-width:1px style E fill:#f9f9f9,stroke:#333,stroke-width:1px style F fill:#f9f9f9,stroke:#333,stroke-width:1px style G fill:#f9f9f9,stroke:#333,stroke-width:1px

点击购买

点击首页立即对话

注册 / 登录

输入key

阅读API文档

输入端点和API Key

开始使用

全文结束

推荐模型

grok-4-fast-reasoning

我们很高兴发布 grok-4-fast,这是 xAI 在成本效益推理模型领域的最新进展。包含两个最新模型,代号分别为:grok-4-fast-reasoning 和 grok-4-fast-noreasoning。

o3

我们最强大的推理模型,在编码、数学、科学和视觉方面表现出色。

gemini-2.0-flash

Gemini 2.0 Flash 提供了下一代功能和改进的能力,包括更快的速度、原生工具使用、多模态生成和 1M 令牌上下文窗口。