OpenAI
Denne siden ble maskinoversatt. Se den opprinnelige engelske artikkelen.

Vanlige spørsmål om Audio API

Generelle spørsmål om Whisper, tale til tekst og Audio API

Oppdatert: 14 hours ago

Audio-API-et støtter to endepunkter for tale til tekst:

  • transcriptions

  • translations

For å komme i gang med Audio-API-et kan du lese utviklerdokumentasjonen vår for tale til tekst.

Hva koster det å bruke Audio-API-et?

Se prissiden vår for detaljer.

Hvilke språk støttes?

Se en liste over støttede språk her.

Hvordan kan vi håndtere store lydfiler?

For opplasting av transkripsjoner til det eldre Audio-API-et legacy/whisper-1 er maksimal forespørselsstørrelse 25 MiB. Nyere transkripsjonsruter for gpt-4o kan bruke annen validering, for eksempel varighets- eller tokenbegrensninger, så sjekk den modellspesifikke dokumentasjonen når du håndterer lange lydinndata fra brukere.

Hvilke strømme-metoder er tilgjengelige?

Det er to måter du kan strømme transkripsjonen på, avhengig av brukstilfellet ditt og om du prøver å transkribere et allerede fullført lydopptak eller håndtere en pågående lydstrøm og bruke OpenAI til å oppdage turer:

Merk at strømming ikke støttes med modellen whisper-1.

Hvilke filformater støttes?

De støttede filformatene er inkludert i API-dokumentasjonen vår.

Kan jeg sende lenker til lydfiler til Audio-API-et?

Nei, du må sende en fil i ett av de støttede lydformatene.

Var denne artikkelen nyttig?