Audio API поддържа две крайни точки за реч към текст:
transcriptionstranslations
За да започнете с Audio API, моля, прочетете нашата документация за разработчици за реч към текст.
Колко струва използването на Audio API?
Вижте нашата страница с цени за подробности.
Кои езици се поддържат?
Вижте списък с поддържаните езици тук.
Как можем да обработваме големи аудиофайлове?
За качвания за транскрипция в Audio API с legacy/whisper-1 максималният размер на заявката е 25 MiB. По-новите маршрути за транскрипция с gpt-4o може да използват различно валидиране, като например ограничения за продължителност или токени, затова проверявайте специфичната за модела документация, когато обработвате дълги аудиовходове от потребители.
Какви методи за стрийминг са налични?
Има два начина да стриймвате транскрипцията си в зависимост от вашия случай на употреба и от това дали се опитвате да транскрибирате вече завършен аудиозапис, или да обработвате текущ аудиопоток и да използвате OpenAI за откриване на редове в разговора:
Имайте предвид, че стриймингът не се поддържа с модела whisper-1.
Какви файлови формати се поддържат?
Поддържаните файлови формати са включени в нашата API документация.
Мога ли да изпращам връзки към аудиофайлове към Audio API?
Не, трябва да изпратите файл в един от поддържаните аудиоформати.
