gpt-4o-transcribe

模型描述

GPT-4o 转录是一个语音转文本模型,使用 GPT-4o 来转录音频。与原始 Whisper 模型相比,它在单词错误率和语言识别及准确性方面有所改善。使用它可以获得更准确的转录。

全文结束

推荐模型

o3

我们最强大的推理模型,在编码、数学、科学和视觉方面表现出色。

gemini-2.0-flash

Gemini 2.0 Flash 提供了下一代功能和改进的能力,包括更快的速度、原生工具使用、多模态生成和 1M 令牌上下文窗口。

DeepSeek-V3-0324

深度寻求-V3-0324 是一个升级的人工智能模型,具有增强的推理、编码、中文写作和网络搜索能力,在某些任务中超越了 GPT-4.5,同时保持 128K 上下文支持和开源 MIT 许可。