OpenAI
이 페이지는 기계 번역되었습니다. 영어 원문 보기

Audio API FAQ

Whisper, speech to text, Audio API에 관한 일반적인 질문

마지막 수정: 8 hours ago

Audio API는 음성을 텍스트로 변환하는 두 가지 엔드포인트를 지원합니다:

  • transcriptions

  • translations

Audio API를 시작하려면 speech to text 개발자 문서를 읽어보세요.

Audio API 사용 비용은 얼마인가요?

자세한 내용은 요금 페이지를 참조하세요.

어떤 언어를 지원하나요?

여기에서 지원 언어 목록을 확인하세요.

대용량 오디오 파일은 어떻게 처리할 수 있나요?

기존 legacy/whisper-1 Audio API 전사 업로드의 최대 요청 크기는 25MiB입니다. 최신 gpt-4o 전사 경로는 오디오 길이나 토큰 한도와 같은 다른 검증을 사용할 수 있으므로, 사용자의 긴 오디오 입력을 처리할 때는 모델별 문서를 확인하세요.

사용할 수 있는 스트리밍 방식은 무엇인가요?

전사 스트리밍 방법은 사용 사례와 이미 완료된 오디오 녹음을 전사하려는지, 또는 진행 중인 오디오 스트림을 처리하면서 OpenAI를 턴 감지에 사용하려는지에 따라 두 가지가 있습니다:

스트리밍은 whisper-1 모델에서 지원되지 않습니다.

어떤 파일 형식을 지원하나요?

지원되는 파일 형식은 API 문서에 포함되어 있습니다.

오디오 파일 링크를 Audio API로 보낼 수 있나요?

아니요. 지원되는 오디오 형식 중 하나의 파일을 보내야 합니다.

이 문서가 도움이 되었나요?