Audio API hỗ trợ hai điểm cuối chuyển giọng nói thành văn bản:
transcriptionstranslations
Để bắt đầu với Audio API, vui lòng đọc tài liệu dành cho nhà phát triển về chuyển giọng nói thành văn bản của chúng tôi.
Chi phí sử dụng Audio API là bao nhiêu?
Hãy xem trang giá của chúng tôi để biết chi tiết.
Những ngôn ngữ nào được hỗ trợ?
Xem danh sách các ngôn ngữ được hỗ trợ tại đây.
Làm thế nào để xử lý các tệp âm thanh lớn?
Đối với các lượt tải lên bản chép lời qua Audio API legacy/whisper-1, kích thước yêu cầu tối đa là 25 MiB. Các tuyến chép lời gpt-4o mới hơn có thể dùng cơ chế xác thực khác, chẳng hạn như giới hạn thời lượng hoặc token, vì vậy hãy kiểm tra tài liệu dành riêng cho mô hình khi xử lý đầu vào âm thanh dài từ người dùng.
Có những phương thức truyền phát nào?
Có hai cách để bạn truyền phát bản chép lời tùy theo trường hợp sử dụng và việc bạn đang muốn chép lại một bản ghi âm đã hoàn tất hay xử lý một luồng âm thanh đang diễn ra và dùng OpenAI để phát hiện lượt nói:
Lưu ý rằng tính năng truyền phát không được hỗ trợ với mô hình whisper-1.
Những định dạng tệp nào được hỗ trợ?
Các định dạng tệp được hỗ trợ có trong tài liệu API của chúng tôi.
Tôi có thể gửi liên kết đến các tệp âm thanh tới Audio API không?
Không, bạn phải gửi một tệp ở một trong các định dạng âm thanh được hỗ trợ.
