Audio-API-et støtter to endepunkter for tale til tekst:
transcriptionstranslations
For å komme i gang med Audio-API-et kan du lese utviklerdokumentasjonen vår for tale til tekst.
Hva koster det å bruke Audio-API-et?
Se prissiden vår for detaljer.
Hvilke språk støttes?
Se en liste over støttede språk her.
Hvordan kan vi håndtere store lydfiler?
For opplasting av transkripsjoner til det eldre Audio-API-et legacy/whisper-1 er maksimal forespørselsstørrelse 25 MiB. Nyere transkripsjonsruter for gpt-4o kan bruke annen validering, for eksempel varighets- eller tokenbegrensninger, så sjekk den modellspesifikke dokumentasjonen når du håndterer lange lydinndata fra brukere.
Hvilke strømme-metoder er tilgjengelige?
Det er to måter du kan strømme transkripsjonen på, avhengig av brukstilfellet ditt og om du prøver å transkribere et allerede fullført lydopptak eller håndtere en pågående lydstrøm og bruke OpenAI til å oppdage turer:
Merk at strømming ikke støttes med modellen whisper-1.
Hvilke filformater støttes?
De støttede filformatene er inkludert i API-dokumentasjonen vår.
Kan jeg sende lenker til lydfiler til Audio-API-et?
Nei, du må sende en fil i ett av de støttede lydformatene.
