Časté dotazy k Audio API

Audio API podporuje dva koncové body pro převod řeči na text:

transcriptions
translations

Začněte s Audio API přečtením naší vývojářské dokumentace k převodu řeči na text.

Kolik stojí používání Audio API?

Podrobnosti najdete na naší stránce s cenami.

Které jazyky jsou podporovány?

Zobrazte si seznam podporovaných jazyků.

Jak můžeme zpracovávat velké zvukové soubory?

U nahrávání pro přepis přes starší Audio API legacy/whisper-1 je maximální velikost požadavku 25 MiB. Novější trasy přepisu gpt-4o mohou používat jiné ověřování, například limity délky trvání nebo tokenů, proto při zpracování dlouhých zvukových vstupů od uživatelů zkontrolujte dokumentaci konkrétního modelu.

Jaké metody streamování jsou k dispozici?

Existují dva způsoby, jak můžete streamovat přepis, v závislosti na vašem případu použití a na tom, zda se snažíte přepsat již dokončenou zvukovou nahrávku, nebo zpracovat probíhající zvukový stream a použít OpenAI k detekci konce promluvy:

Upozorňujeme, že streamování není podporováno u modelu whisper-1.

Jaké formáty souborů jsou podporovány?

Podporované formáty souborů jsou uvedeny v naší dokumentaci k API.

Mohu do Audio API posílat odkazy na zvukové soubory?

Ne, musíte odeslat soubor v jednom z podporovaných zvukových formátů.

Byl tento článek užitečný?