OpenAI
页面内容为机器翻译。查看英文原文

Audio API 常见问题

关于 Whisper、语音转文本和 Audio API 的常见问题

更新于:8 days ago

音频 API 支持两个语音转文本端点:

  • transcriptions

  • translations

要开始使用音频 API,请阅读我们的语音转文本开发者文档


使用音频 API 的费用是多少?

详情请参阅我们的价格页面


支持哪些语言?

在此查看支持的语言列表


如何处理大型音频文件?

对于旧版/whisper-1 音频 API 转录上传,最大请求大小为 25 MiB。较新的 gpt-4o 转录路由可能使用不同的验证方式,例如时长或 Token 限制,因此在处理用户的长音频输入时,请查看特定模型的文档。


有哪些流式传输方法可用?

你可以根据使用场景,以及是要转录已经完成的音频录制,还是处理正在进行的音频流并使用 OpenAI 进行轮次检测,选择以下两种方式来流式传输转录内容:

请注意,whisper-1 模型不支持流式传输。

支持哪些文件格式?

支持的文件格式列在我们的 API 文档中


我可以向音频 API 发送音频文件链接吗?

不可以,你必须发送一种受支持音频格式的文件。

这篇文章对你有帮助吗?