Audio API 常見問題

Audio API 支援兩個語音轉文字端點：

transcriptions
translations

若要開始使用 Audio API，請閱讀我們的語音轉文字開發者文件。

使用 Audio API 的費用是多少？

詳情請參閱我們的定價頁面。

支援哪些語言？

在此查看支援的語言清單。

我們該如何處理大型音訊檔案？

對於舊版/whisper-1 Audio API 轉錄上傳，請求大小上限為 25 MiB。較新的 gpt-4o 轉錄路由可能會使用不同的驗證方式，例如時長或 Token 限制，因此在處理使用者提供的長音訊輸入時，請查看模型專屬文件。

有哪些串流方法可用？

你可以根據使用案例，以及你是要轉錄已完成的音訊錄音，還是要處理進行中的音訊串流並使用 OpenAI 進行輪次偵測，透過兩種方式串流你的轉錄內容：

請注意，whisper-1 模型不支援串流。

支援哪些檔案格式？

支援的檔案格式列於我們的 API 文件中。

我可以將音訊檔案連結傳送給 Audio API 嗎？

不行，你必須傳送其中一種受支援音訊格式的檔案。

這篇文章有幫助嗎？