Audio API podržava dvije krajnje točke za pretvaranje govora u tekst:
transcriptionstranslations
Za početak rada s Audio API-jem pročitajte našu dokumentaciju za razvojne programere o pretvaranju govora u tekst.
Koliko košta upotreba Audio API-ja?
Pojedinosti potražite na našoj stranici s cijenama.
Koji su jezici podržani?
Pogledajte popis podržanih jezika ovdje.
Kako možemo rukovati velikim audiodatotekama?
Kod prijenosa transkripcija za legacy/whisper-1 Audio API, maksimalna veličina zahtjeva iznosi 25 MiB. Novije rute za transkripciju gpt-4o mogu upotrebljavati drukčiju provjeru valjanosti, primjerice ograničenja trajanja ili tokena, stoga pri obradi dugih audio unosa korisnika provjerite dokumentaciju za određeni model.
Koje su metode strujanja dostupne?
Postoje dva načina strujanja transkripcije, ovisno o vašem slučaju upotrebe i o tome pokušavate li transkribirati već dovršenu audiosnimku ili obraditi kontinuirani tok zvuka te upotrijebiti OpenAI za detekciju izmjena:
Imajte na umu da strujanje nije podržano s modelom whisper-1.
Koji su formati datoteka podržani?
Podržani formati datoteka navedeni su u našoj API dokumentaciji.
Mogu li Audio API-ju slati poveznice na audiodatoteke?
Ne, morate poslati datoteku u jednom od podržanih audioformata.
