OpenAI
Tato stránka byla přeložena strojově. Zobrazit původní článek v angličtině.

Časté dotazy k Audio API

Obecné otázky o Whisper, převodu řeči na text a Audio API

Aktualizováno: 2 days ago

Audio API podporuje dva koncové body pro převod řeči na text:

  • transcriptions

  • translations

Chcete-li začít s Audio API, přečtěte si naši vývojářskou dokumentaci k převodu řeči na text.

Kolik stojí používání Audio API?

Podrobnosti najdete na naší stránce s cenami.

Které jazyky jsou podporovány?

Seznam podporovaných jazyků najdete zde.

Jak můžeme pracovat s velkými zvukovými soubory?

U nahrávání přepisů do Audio API pro legacy/whisper-1 je maximální velikost požadavku 25 MiB. Novější trasy přepisu gpt-4o mohou používat jiné ověřování, například limity délky nebo tokenů, proto při práci s dlouhými zvukovými vstupy od uživatelů zkontrolujte dokumentaci ke konkrétnímu modelu.

Jaké metody streamování jsou k dispozici?

V závislosti na vašem případu použití a na tom, zda chcete přepsat již dokončenou zvukovou nahrávku, nebo zpracovat probíhající zvukový stream a použít OpenAI k detekci tahů v konverzaci, můžete přepis streamovat dvěma způsoby:

Upozorňujeme, že streamování není podporováno u modelu whisper-1.

Jaké formáty souborů jsou podporovány?

Podporované formáty souborů jsou uvedeny v naší dokumentaci k API.

Mohu do Audio API posílat odkazy na zvukové soubory?

Ne, musíte odeslat soubor v jednom z podporovaných zvukových formátů.

Byl tento článek užitečný?