Audio API mendukung dua endpoint ucapan ke teks:
transcriptionstranslations
Untuk mulai menggunakan Audio API, baca dokumentasi developer ucapan ke teks kami.
Berapa biaya penggunaan Audio API?
Lihat halaman harga kami untuk detailnya.
Bahasa apa saja yang didukung?
Lihat daftar bahasa yang didukung di sini.
Bagaimana cara menangani file audio besar?
Untuk unggahan transkripsi Audio API legacy/whisper-1, ukuran permintaan maksimum adalah 25 MiB. Rute transkripsi gpt-4o yang lebih baru mungkin menggunakan validasi yang berbeda, seperti batas durasi atau token, jadi periksa dokumentasi khusus model saat menangani input audio panjang dari pengguna.
Metode streaming apa saja yang tersedia?
Ada dua cara untuk melakukan streaming transkripsi, tergantung kasus penggunaan Anda dan apakah Anda mencoba mentranskripsikan rekaman audio yang sudah selesai atau menangani stream audio yang sedang berlangsung dan menggunakan OpenAI untuk deteksi giliran bicara:
Perhatikan bahwa streaming tidak didukung dengan model whisper-1.
Format file apa saja yang didukung?
Format file yang didukung tercantum di dokumentasi API kami.
Bisakah saya mengirim tautan ke file audio ke Audio API?
Tidak, Anda harus mengirim file dalam salah satu format audio yang didukung.
