Audio API iki konuşmadan metne uç noktasını destekler:
transcriptionstranslations
Audio API'yi kullanmaya başlamak için lütfen konuşmadan metne geliştirici dokümantasyonumuzu okuyun.
Audio API'yi kullanmanın maliyeti nedir?
Ayrıntılar için fiyatlandırma sayfamıza bakın.
Hangi diller destekleniyor?
Desteklenen dillerin listesini burada görüntüleyin.
Büyük ses dosyalarını nasıl işleyebiliriz?
Eski legacy/whisper-1 Audio API transkripsiyon yüklemelerinde maksimum istek boyutu 25 MiB'dir. Daha yeni gpt-4o transkripsiyon yollarında süre veya token sınırları gibi farklı doğrulamalar kullanılabilir; bu nedenle kullanıcıların uzun ses girdilerini işlerken modele özgü dokümantasyonu kontrol edin.
Hangi akış yöntemleri kullanılabilir?
Kullanım senaryonuza ve zaten tamamlanmış bir ses kaydını mı yazıya dökmeye çalıştığınıza yoksa devam eden bir ses akışını işleyip sıra algılama için OpenAI'yi mi kullandığınıza bağlı olarak transkripsiyonunuzu akışla iletmenin iki yolu vardır:
Akışın whisper-1 modeliyle desteklenmediğini unutmayın.
Hangi dosya biçimleri destekleniyor?
Desteklenen dosya biçimleri API dokümanlarımızda yer alır.
Audio API'ye ses dosyalarının bağlantılarını gönderebilir miyim?
Hayır, desteklenen ses biçimlerinden birinde bir dosya göndermeniz gerekir.
