Audio API podporuje dva koncové body pro převod řeči na text:
transcriptionstranslations
Chcete-li začít s Audio API, přečtěte si naši vývojářskou dokumentaci k převodu řeči na text.
Kolik stojí používání Audio API?
Podrobnosti najdete na naší stránce s cenami.
Které jazyky jsou podporovány?
Seznam podporovaných jazyků najdete zde.
Jak můžeme pracovat s velkými zvukovými soubory?
U nahrávání přepisů do Audio API pro legacy/whisper-1 je maximální velikost požadavku 25 MiB. Novější trasy přepisu gpt-4o mohou používat jiné ověřování, například limity délky nebo tokenů, proto při práci s dlouhými zvukovými vstupy od uživatelů zkontrolujte dokumentaci ke konkrétnímu modelu.
Jaké metody streamování jsou k dispozici?
V závislosti na vašem případu použití a na tom, zda chcete přepsat již dokončenou zvukovou nahrávku, nebo zpracovat probíhající zvukový stream a použít OpenAI k detekci tahů v konverzaci, můžete přepis streamovat dvěma způsoby:
Upozorňujeme, že streamování není podporováno u modelu whisper-1.
Jaké formáty souborů jsou podporovány?
Podporované formáty souborů jsou uvedeny v naší dokumentaci k API.
Mohu do Audio API posílat odkazy na zvukové soubory?
Ne, musíte odeslat soubor v jednom z podporovaných zvukových formátů.
