OpenAI
Táto stránka bola strojovo preložená. Prečítaj si pôvodný článok v angličtine.

Časté otázky k Audio API

Všeobecné otázky o Whisper, prevode reči na text a Audio API

Aktualizované: 10 days ago

Audio API podporuje dva koncové body na prevod reči na text:

  • transcriptions

  • translations

Ak chcete začať používať Audio API, prečítajte si našu vývojársku dokumentáciu k prevodu reči na text.


Koľko stojí používanie Audio API?

Podrobnosti nájdete na našej stránke s cenami.


Ktoré jazyky sú podporované?

Pozrite si zoznam podporovaných jazykov tu.


Ako môžeme spracovať veľké zvukové súbory?

Pri nahrávaní prepisov cez staršiu Audio API legacy/whisper-1 je maximálna veľkosť požiadavky 25 MiB. Novšie trasy prepisu gpt-4o môžu používať odlišné overovanie, napríklad limity trvania alebo tokenov, preto si pri spracovaní dlhých zvukových vstupov od používateľov pozrite dokumentáciu konkrétneho modelu.


Aké metódy streamovania sú k dispozícii?

Prepis môžete streamovať dvoma spôsobmi v závislosti od prípadu použitia a od toho, či chcete prepísať už dokončenú zvukovú nahrávku, alebo spracovať prebiehajúci zvukový stream a použiť OpenAI na rozpoznávanie ťahov v konverzácii:

Upozorňujeme, že streamovanie nie je podporované s modelom whisper-1.

Ktoré formáty súborov sú podporované?

Podporované formáty súborov sú uvedené v našej dokumentácii API.


Môžem do Audio API posielať odkazy na zvukové súbory?

Nie, musíte odoslať súbor v jednom z podporovaných zvukových formátov.

Bol tento článok užitočný?