OpenAI
页面内容为机器翻译。查看英文原文

Audio API 常见问题

关于 Whisper、语音转文本和 Audio API 的常见问题

更新于:7 hours ago

Audio API 支持两个语音转文本端点:

  • transcriptions

  • translations

要开始使用 Audio API,请阅读我们的语音转文本开发者文档

使用 Audio API 的费用是多少?

详情请参阅我们的定价页面

支持哪些语言?

可在此处查看支持的语言列表

如何处理大型音频文件?

对于 legacy/whisper-1 Audio API 转写上传,请求的最大大小为 25 MiB。较新的 gpt-4o 转写路由可能使用不同的验证方式,例如时长或 Token 限制,因此在处理用户的长音频输入时,请查看特定于模型的文档。

有哪些流式传输方法可用?

根据你的使用场景,以及你是要转写已完成的音频录音,还是处理持续进行的音频流并使用 OpenAI 进行轮次检测,你可以通过两种方式流式传输转写结果:

请注意,whisper-1 模型不支持流式传输。

支持哪些文件格式?

支持的文件格式已包含在我们的API 文档中。

我可以将音频文件的链接发送到 Audio API 吗?

不可以,你必须发送一种受支持音频格式的文件。

这篇文章对你有帮助吗?