Audio API palaiko du kalbos pavertimo tekstu prieigos taškus:
transcriptionstranslations
Norėdami pradėti naudotis Audio API, perskaitykite mūsų kalbos pavertimo tekstu kūrėjų dokumentaciją.
Kiek kainuoja naudotis Audio API?
Išsamią informaciją rasite mūsų kainodaros puslapyje.
Kokios kalbos palaikomos?
Čia peržiūrėkite palaikomų kalbų sąrašą.
Kaip galime tvarkyti didelius garso failus?
Naudojant senesnius legacy/whisper-1 Audio API transkripcijos įkėlimus, maksimalus užklausos dydis yra 25 MiB. Naujesni gpt-4o transkripcijos maršrutai gali naudoti kitokį tikrinimą, pvz., trukmės ar žetonų limitus, todėl tvarkydami ilgus naudotojų garso įvesties duomenis peržiūrėkite konkretaus modelio dokumentaciją.
Kokie srautinio perdavimo metodai prieinami?
Transkripciją galite perduoti srautiniu būdu dviem būdais, priklausomai nuo naudojimo atvejo ir nuo to, ar bandote transkribuoti jau baigtą garso įrašą, ar tvarkyti vykstantį garso srautą ir naudoti OpenAI replikų kaitai aptikti:
Atminkite, kad srautinis perdavimas nepalaikomas naudojant whisper-1 modelį.
Kokie failų formatai palaikomi?
Palaikomi failų formatai nurodyti mūsų API dokumentacijoje.
Ar galiu Audio API siųsti nuorodas į garso failus?
Ne, turite siųsti failą vienu iš palaikomų garso formatų.
