Audio API 支持两个语音转文本端点:
transcriptionstranslations
要开始使用 Audio API,请阅读我们的语音转文本开发者文档。
使用 Audio API 的费用是多少?
详情请参阅我们的定价页面。
支持哪些语言?
可在此处查看支持的语言列表。
如何处理大型音频文件?
对于 legacy/whisper-1 Audio API 转写上传,请求的最大大小为 25 MiB。较新的 gpt-4o 转写路由可能使用不同的验证方式,例如时长或 Token 限制,因此在处理用户的长音频输入时,请查看特定于模型的文档。
有哪些流式传输方法可用?
根据你的使用场景,以及你是要转写已完成的音频录音,还是处理持续进行的音频流并使用 OpenAI 进行轮次检测,你可以通过两种方式流式传输转写结果:
请注意,whisper-1 模型不支持流式传输。
支持哪些文件格式?
支持的文件格式已包含在我们的API 文档中。
我可以将音频文件的链接发送到 Audio API 吗?
不可以,你必须发送一种受支持音频格式的文件。
