ЧЗВ за Audio API

Audio API поддържа две крайни точки за преобразуване на реч в текст:

transcriptions
translations

За да започнете работа с Audio API, моля, прочетете нашата документация за разработчици за преобразуване на реч в текст.

Колко струва използването на Audio API?

Вижте нашата страница с цени за подробности.

Кои езици се поддържат?

Вижте списък с поддържаните езици тук.

Как можем да обработваме големи аудиофайлове?

За качвания на транскрипции през legacy/whisper-1 Audio API максималният размер на заявката е 25 MiB. По-новите маршрути за транскрипция gpt-4o може да използват различна валидация, например ограничения за продължителност или токени, затова проверявайте документацията за конкретния модел, когато обработвате дълги аудиовходове от потребители.

Какви методи за поточно предаване са налични?

Има два начина да предавате транскрипцията си поточно в зависимост от случая на употреба и от това дали се опитвате да транскрибирате вече завършен аудиозапис, или да обработвате текущ аудиопоток и да използвате OpenAI за откриване на реда за говорене:

Имайте предвид, че поточното предаване не се поддържа с модела whisper-1.

Какви файлови формати се поддържат?

Поддържаните файлови формати са посочени в нашата документация за API.

Мога ли да изпращам връзки към аудиофайлове до Audio API?

Не, трябва да изпратите файл в един от поддържаните аудиоформати.

Беше ли Ви полезна тази статия?