OpenAI
此頁面由機器翻譯。查看原文英文文章

Audio API 常見問題

關於 Whisper、語音轉文字及 Audio API 的一般問題

更新日期:7 hours ago

Audio API 支援兩個語音轉文字端點:

  • transcriptions

  • translations

如要開始使用 Audio API,請閱讀我們的語音轉文字開發者文件

使用 Audio API 的費用是多少?

詳情請參閱我們的定價頁面

支援哪些語言?

在此查看支援語言清單

如何處理大型音訊檔案?

對於舊版/whisper-1 Audio API 轉錄上載,要求大小上限為 25 MiB。較新的 gpt-4o 轉錄路由可能採用不同的驗證方式,例如時長或 token 限制,因此在處理使用者的長音訊輸入時,請查閱特定模型的文件。

有哪些串流方法可用?

你可按使用情況,以及你是要轉錄已完成的錄音,還是處理持續進行的音訊串流並使用 OpenAI 進行輪次偵測,選擇以下兩種轉錄串流方式之一:

請注意,whisper-1模型不支援串流。

支援哪些檔案格式?

支援的檔案格式已列於我們的API 文件中。

我可以將音訊檔案的連結傳送至 Audio API 嗎?

不可以,你必須傳送其中一種支援的音訊格式檔案。

這篇文章對你有幫助嗎?