OpenAI
Тази страница е машинно преведена. Вижте оригиналната статия на английски език.

ЧЗВ за Audio API

Общи въпроси за Whisper, реч към текст, Audio API

Актуализирано: 10 days ago

Audio API поддържа две крайни точки за преобразуване на реч в текст:

  • transcriptions

  • translations

За да започнете работа с Audio API, моля, прочетете нашата документация за разработчици за преобразуване на реч в текст.


Колко струва използването на Audio API?

Вижте нашата страница с цени за подробности.


Кои езици се поддържат?

Вижте списък с поддържаните езици тук.


Как можем да обработваме големи аудиофайлове?

За качвания на транскрипции през legacy/whisper-1 Audio API максималният размер на заявката е 25 MiB. По-новите маршрути за транскрипция gpt-4o може да използват различна валидация, например ограничения за продължителност или токени, затова проверявайте документацията за конкретния модел, когато обработвате дълги аудиовходове от потребители.


Какви методи за поточно предаване са налични?

Има два начина да предавате транскрипцията си поточно в зависимост от случая на употреба и от това дали се опитвате да транскрибирате вече завършен аудиозапис, или да обработвате текущ аудиопоток и да използвате OpenAI за откриване на реда за говорене:

Имайте предвид, че поточното предаване не се поддържа с модела whisper-1.

Какви файлови формати се поддържат?

Поддържаните файлови формати са посочени в нашата документация за API.


Мога ли да изпращам връзки към аудиофайлове до Audio API?

Не, трябва да изпратите файл в един от поддържаните аудиоформати.

Беше ли Ви полезна тази статия?