音频 API 支持两个语音转文本端点:
transcriptionstranslations
要开始使用音频 API,请阅读我们的语音转文本开发者文档。
使用音频 API 的费用是多少?
详情请参阅我们的价格页面。
支持哪些语言?
在此查看支持的语言列表。
如何处理大型音频文件?
对于旧版/whisper-1 音频 API 转录上传,最大请求大小为 25 MiB。较新的 gpt-4o 转录路由可能使用不同的验证方式,例如时长或 Token 限制,因此在处理用户的长音频输入时,请查看特定模型的文档。
有哪些流式传输方法可用?
你可以根据使用场景,以及是要转录已经完成的音频录制,还是处理正在进行的音频流并使用 OpenAI 进行轮次检测,选择以下两种方式来流式传输转录内容:
请注意,whisper-1 模型不支持流式传输。
支持哪些文件格式?
支持的文件格式列在我们的 API 文档中。
我可以向音频 API 发送音频文件链接吗?
不可以,你必须发送一种受支持音频格式的文件。
