OpenAI
Deze pagina is automatisch vertaald. Bekijk het oorspronkelijke Engelstalige artikel.

Veelgestelde vragen over de Audio API

Algemene vragen over Whisper, spraak-naar-tekst en de Audio API

Bijgewerkt: 2 days ago

De Audio API ondersteunt twee endpoints voor spraak-naar-tekst:

  • transcriptions

  • translations

Lees om aan de slag te gaan met de Audio API onze ontwikkelaarsdocumentatie voor spraak-naar-tekst.

Wat kost het gebruik van de Audio API?

Zie onze pagina met prijzen voor meer informatie.

Welke talen worden ondersteund?

Bekijk hier een lijst met ondersteunde talen.

Hoe kunnen we grote audiobestanden verwerken?

Voor transcriptie-uploads naar de verouderde/whisper-1 Audio API is de maximale aanvraaggrootte 25 MiB. Nieuwere transcriptieroutes van gpt-4o kunnen andere validatie gebruiken, zoals duur- of tokenlimieten, dus controleer de modelspecifieke documentatie wanneer je lange audio-invoer van gebruikers verwerkt.

Welke streamingmethoden zijn beschikbaar?

Er zijn twee manieren om je transcriptie te streamen, afhankelijk van je use case en of je een al voltooide audio-opname wilt transcriberen of een doorlopende audiostream wilt verwerken en OpenAI wilt gebruiken voor beurtendetectie:

Houd er rekening mee dat streaming niet wordt ondersteund met het model whisper-1.

Welke bestandsindelingen worden ondersteund?

De ondersteunde bestandsindelingen vind je in onze API-documentatie.

Kan ik links naar audiobestanden naar de Audio API sturen?

Nee, je moet een bestand verzenden in een van de ondersteunde audioformaten.

Was dit artikel nuttig?