Audio API는 두 가지 음성-텍스트 엔드포인트를 지원합니다:
transcriptionstranslations
Audio API를 시작하려면 음성-텍스트 개발자 문서를 읽어 보세요.
Audio API 사용 비용은 얼마인가요?
자세한 내용은 가격 페이지를 참조하세요.
어떤 언어가 지원되나요?
지원되는 언어 목록을 확인하세요.
대용량 오디오 파일은 어떻게 처리할 수 있나요?
레거시/whisper-1 Audio API 전사 업로드의 최대 요청 크기는 25MiB입니다. 최신 gpt-4o 전사 경로는 지속 시간 또는 토큰 제한과 같은 다른 유효성 검사를 사용할 수 있으므로, 사용자의 긴 오디오 입력을 처리할 때는 모델별 문서를 확인하세요.
어떤 스트리밍 방법을 사용할 수 있나요?
사용 사례와 이미 완료된 오디오 녹음을 전사하려는지, 진행 중인 오디오 스트림을 처리하고 OpenAI를 턴 감지에 사용하려는지에 따라 전사를 스트리밍하는 방법은 두 가지가 있습니다:
whisper-1 모델에서는 스트리밍이 지원되지 않습니다.
어떤 파일 형식이 지원되나요?
지원되는 파일 형식은 API 문서에 포함되어 있습니다.
오디오 파일 링크를 Audio API로 보낼 수 있나요?
아니요. 지원되는 오디오 형식 중 하나의 파일을 보내야 합니다.
