Audio API podporuje dva koncové body na prevod reči na text:
transcriptionstranslations
Ak chcete začať používať Audio API, prečítajte si našu vývojársku dokumentáciu k prevodu reči na text.
Koľko stojí používanie Audio API?
Podrobnosti nájdete na našej stránke s cenami.
Ktoré jazyky sú podporované?
Pozrite si zoznam podporovaných jazykov tu.
Ako môžeme spracovať veľké zvukové súbory?
Pri nahrávaní prepisov cez staršiu Audio API legacy/whisper-1 je maximálna veľkosť požiadavky 25 MiB. Novšie trasy prepisu gpt-4o môžu používať odlišné overovanie, napríklad limity trvania alebo tokenov, preto si pri spracovaní dlhých zvukových vstupov od používateľov pozrite dokumentáciu konkrétneho modelu.
Aké metódy streamovania sú k dispozícii?
Prepis môžete streamovať dvoma spôsobmi v závislosti od prípadu použitia a od toho, či chcete prepísať už dokončenú zvukovú nahrávku, alebo spracovať prebiehajúci zvukový stream a použiť OpenAI na rozpoznávanie ťahov v konverzácii:
Upozorňujeme, že streamovanie nie je podporované s modelom whisper-1.
Ktoré formáty súborov sú podporované?
Podporované formáty súborov sú uvedené v našej dokumentácii API.
Môžem do Audio API posielať odkazy na zvukové súbory?
Nie, musíte odoslať súbor v jednom z podporovaných zvukových formátov.
