Audio API 常见问题

音频 API 支持两个语音转文本端点：

transcriptions
translations

要开始使用音频 API，请阅读我们的语音转文本开发者文档。

使用音频 API 的费用是多少？

详情请参阅我们的价格页面。

支持哪些语言？

在此查看支持的语言列表。

如何处理大型音频文件？

对于旧版/whisper-1 音频 API 转录上传，最大请求大小为 25 MiB。较新的 gpt-4o 转录路由可能使用不同的验证方式，例如时长或 Token 限制，因此在处理用户的长音频输入时，请查看特定模型的文档。

有哪些流式传输方法可用？

你可以根据使用场景，以及是要转录已经完成的音频录制，还是处理正在进行的音频流并使用 OpenAI 进行轮次检测，选择以下两种方式来流式传输转录内容：

请注意，whisper-1 模型不支持流式传输。

支持哪些文件格式？

支持的文件格式列在我们的 API 文档中。

我可以向音频 API 发送音频文件链接吗？

不可以，你必须发送一种受支持音频格式的文件。

这篇文章对你有帮助吗？