De Audio API ondersteunt twee endpoints voor spraak-naar-tekst:
transcriptionstranslations
Lees om aan de slag te gaan met de Audio API onze ontwikkelaarsdocumentatie voor spraak-naar-tekst.
Wat kost het gebruik van de Audio API?
Zie onze pagina met prijzen voor meer informatie.
Welke talen worden ondersteund?
Bekijk hier een lijst met ondersteunde talen.
Hoe kunnen we grote audiobestanden verwerken?
Voor transcriptie-uploads naar de verouderde/whisper-1 Audio API is de maximale aanvraaggrootte 25 MiB. Nieuwere transcriptieroutes van gpt-4o kunnen andere validatie gebruiken, zoals duur- of tokenlimieten, dus controleer de modelspecifieke documentatie wanneer je lange audio-invoer van gebruikers verwerkt.
Welke streamingmethoden zijn beschikbaar?
Er zijn twee manieren om je transcriptie te streamen, afhankelijk van je use case en of je een al voltooide audio-opname wilt transcriberen of een doorlopende audiostream wilt verwerken en OpenAI wilt gebruiken voor beurtendetectie:
Houd er rekening mee dat streaming niet wordt ondersteund met het model whisper-1.
Welke bestandsindelingen worden ondersteund?
De ondersteunde bestandsindelingen vind je in onze API-documentatie.
Kan ik links naar audiobestanden naar de Audio API sturen?
Nee, je moet een bestand verzenden in een van de ondersteunde audioformaten.
