Audio API podporuje dva koncové body pro převod řeči na text:
transcriptionstranslations
Začněte s Audio API přečtením naší vývojářské dokumentace k převodu řeči na text.
Kolik stojí používání Audio API?
Podrobnosti najdete na naší stránce s cenami.
Které jazyky jsou podporovány?
Zobrazte si seznam podporovaných jazyků.
Jak můžeme zpracovávat velké zvukové soubory?
U nahrávání pro přepis přes starší Audio API legacy/whisper-1 je maximální velikost požadavku 25 MiB. Novější trasy přepisu gpt-4o mohou používat jiné ověřování, například limity délky trvání nebo tokenů, proto při zpracování dlouhých zvukových vstupů od uživatelů zkontrolujte dokumentaci konkrétního modelu.
Jaké metody streamování jsou k dispozici?
Existují dva způsoby, jak můžete streamovat přepis, v závislosti na vašem případu použití a na tom, zda se snažíte přepsat již dokončenou zvukovou nahrávku, nebo zpracovat probíhající zvukový stream a použít OpenAI k detekci konce promluvy:
Upozorňujeme, že streamování není podporováno u modelu whisper-1.
Jaké formáty souborů jsou podporovány?
Podporované formáty souborů jsou uvedeny v naší dokumentaci k API.
Mohu do Audio API posílat odkazy na zvukové soubory?
Ne, musíte odeslat soubor v jednom z podporovaných zvukových formátů.
