Časté otázky k Audio API

Audio API podporuje dva koncové body na prevod reči na text:

transcriptions
translations

Ak chcete začať používať Audio API, prečítajte si našu vývojársku dokumentáciu k prevodu reči na text.

Koľko stojí používanie Audio API?

Podrobnosti nájdete na našej stránke s cenami.

Ktoré jazyky sú podporované?

Pozrite si zoznam podporovaných jazykov tu.

Ako môžeme spracovať veľké zvukové súbory?

Pri nahrávaní prepisov cez staršiu Audio API legacy/whisper-1 je maximálna veľkosť požiadavky 25 MiB. Novšie trasy prepisu gpt-4o môžu používať odlišné overovanie, napríklad limity trvania alebo tokenov, preto si pri spracovaní dlhých zvukových vstupov od používateľov pozrite dokumentáciu konkrétneho modelu.

Aké metódy streamovania sú k dispozícii?

Prepis môžete streamovať dvoma spôsobmi v závislosti od prípadu použitia a od toho, či chcete prepísať už dokončenú zvukovú nahrávku, alebo spracovať prebiehajúci zvukový stream a použiť OpenAI na rozpoznávanie ťahov v konverzácii:

Upozorňujeme, že streamovanie nie je podporované s modelom whisper-1.

Ktoré formáty súborov sú podporované?

Podporované formáty súborov sú uvedené v našej dokumentácii API.

Môžem do Audio API posielať odkazy na zvukové súbory?

Nie, musíte odoslať súbor v jednom z podporovaných zvukových formátov.

Bol tento článok užitočný?