Vanlige spørsmål om Audio API

Audio API støtter to endepunkter for tale til tekst:

transcriptions
translations

For å komme i gang med Audio API kan du lese vår utviklerdokumentasjon for tale til tekst.

Hvor mye koster det å bruke Audio API?

Se prissiden vår for mer informasjon.

Hvilke språk støttes?

Se en liste over støttede språk her.

Hvordan kan vi håndtere store lydfiler?

For transkripsjonsopplastinger til den eldre Audio API-en legacy/whisper-1 er maksimal forespørselsstørrelse 25 MiB. Nyere transkripsjonsruter for gpt-4o kan bruke annen validering, for eksempel varighets- eller tokengrenser, så sjekk den modellspesifikke dokumentasjonen når du håndterer lange lydinndata fra brukere.

Hvilke strømmetoder er tilgjengelige?

Det finnes to måter du kan strømme transkripsjonen på, avhengig av bruksområdet ditt og om du prøver å transkribere et allerede fullført lydopptak eller håndtere en pågående lydstrøm og bruke OpenAI til turgjenkjenning:

Vær oppmerksom på at strømming ikke støttes med whisper-1-modellen.

Hvilke filformater støttes?

De støttede filformatene er inkludert i API-dokumentasjonen vår.

Kan jeg sende lenker til lydfiler til Audio API?

Nei, du må sende en fil i et av de støttede lydformatene.

Var denne artikkelen nyttig?