OpenAI
Tato stránka byla přeložena strojově. Zobrazit původní článek v angličtině.

Časté dotazy k Audio API

Obecné otázky o Whisper, převodu řeči na text a Audio API

Aktualizováno: 11 days ago

Audio API podporuje dva koncové body pro převod řeči na text:

  • transcriptions

  • translations

Začněte s Audio API přečtením naší vývojářské dokumentace k převodu řeči na text.


Kolik stojí používání Audio API?

Podrobnosti najdete na naší stránce s cenami.


Které jazyky jsou podporovány?

Zobrazte si seznam podporovaných jazyků.


Jak můžeme zpracovávat velké zvukové soubory?

U nahrávání pro přepis přes starší Audio API legacy/whisper-1 je maximální velikost požadavku 25 MiB. Novější trasy přepisu gpt-4o mohou používat jiné ověřování, například limity délky trvání nebo tokenů, proto při zpracování dlouhých zvukových vstupů od uživatelů zkontrolujte dokumentaci konkrétního modelu.


Jaké metody streamování jsou k dispozici?

Existují dva způsoby, jak můžete streamovat přepis, v závislosti na vašem případu použití a na tom, zda se snažíte přepsat již dokončenou zvukovou nahrávku, nebo zpracovat probíhající zvukový stream a použít OpenAI k detekci konce promluvy:

Upozorňujeme, že streamování není podporováno u modelu whisper-1.

Jaké formáty souborů jsou podporovány?

Podporované formáty souborů jsou uvedeny v naší dokumentaci k API.


Mohu do Audio API posílat odkazy na zvukové soubory?

Ne, musíte odeslat soubor v jednom z podporovaných zvukových formátů.

Byl tento článek užitečný?