Audio API 支援兩個語音轉文字端點:
transcriptionstranslations
如要開始使用 Audio API,請閱讀我們的語音轉文字開發人員文件。
使用 Audio API 的費用是多少?
詳情請參閱我們的定價頁面。
支援哪些語言?
在此查看支援語言清單。
我們可以如何處理大型音訊檔案?
對於 legacy/whisper-1 Audio API 轉錄上傳,要求大小上限為 25 MiB。較新的 gpt-4o 轉錄路由可能會使用不同驗證,例如時長或 token 限制,因此在處理使用者的長音訊輸入時,請查看模型專屬文件。
有哪些串流方式可用?
視乎你的使用情境,以及你是要轉錄已完成的錄音,還是處理持續進行的音訊串流並使用 OpenAI 進行回合偵測,你可以用兩種方式串流傳送轉錄:
請注意,whisper-1 模型不支援串流。
支援哪些檔案格式?
支援的檔案格式已列於我們的 API 文件。
我可以向 Audio API 傳送音訊檔案連結嗎?
不可以,你必須傳送其中一種受支援音訊格式的檔案。
