OpenAI
Ova je stranica strojno prevedena. Pogledajte izvorni članak na engleskom jeziku.

ČPP za Audio API

Opća pitanja o Whisperu, pretvaranju govora u tekst i Audio API-ju

Ažurirano: 2 days ago

Audio API podržava dvije krajnje točke za pretvaranje govora u tekst:

  • transcriptions

  • translations

Za početak rada s Audio API-jem pročitajte našu dokumentaciju za razvojne programere o pretvaranju govora u tekst.


Koliko košta upotreba Audio API-ja?

Pojedinosti potražite na našoj stranici s cijenama.


Koji su jezici podržani?

Pogledajte popis podržanih jezika ovdje.


Kako možemo rukovati velikim audiodatotekama?

Kod prijenosa transkripcija za legacy/whisper-1 Audio API, maksimalna veličina zahtjeva iznosi 25 MiB. Novije rute za transkripciju gpt-4o mogu upotrebljavati drukčiju provjeru valjanosti, primjerice ograničenja trajanja ili tokena, stoga pri obradi dugih audio unosa korisnika provjerite dokumentaciju za određeni model.


Koje su metode strujanja dostupne?

Postoje dva načina strujanja transkripcije, ovisno o vašem slučaju upotrebe i o tome pokušavate li transkribirati već dovršenu audiosnimku ili obraditi kontinuirani tok zvuka te upotrijebiti OpenAI za detekciju izmjena:

Imajte na umu da strujanje nije podržano s modelom whisper-1.

Koji su formati datoteka podržani?

Podržani formati datoteka navedeni su u našoj API dokumentaciji.


Mogu li Audio API-ju slati poveznice na audiodatoteke?

Ne, morate poslati datoteku u jednom od podržanih audioformata.

Je li vam ovaj članak bio koristan?