Audio API के सामान्य प्रश्न

Whisper, स्पीच-टू-टेक्स्ट और Audio API के बारे में सामान्य प्रश्न

ऑडियो API दो वाणी-से-पाठ एंडपॉइंट का समर्थन करता है:

transcriptions
translations

ऑडियो API के साथ शुरू करने के लिए, कृपया हमारा वाणी-से-पाठ डेवलपर दस्तावेज़ पढ़ें.

ऑडियो API का उपयोग करने की लागत कितनी है?

विवरण के लिए हमारा मूल्य निर्धारण पेज देखें.

कौन-सी भाषाएँ समर्थित हैं?

समर्थित भाषाओं की सूची यहाँ देखें.

हम बड़ी ऑडियो फ़ाइलों को कैसे संभाल सकते हैं?

लेगेसी/whisper-1 ऑडियो API ट्रांसक्रिप्शन अपलोड के लिए, अधिकतम अनुरोध आकार 25 MiB है. नए gpt-4o ट्रांसक्रिप्शन रूट अलग-अलग सत्यापन, जैसे अवधि या टोकन सीमाएँ, का उपयोग कर सकते हैं, इसलिए उपयोगकर्ताओं से लंबे ऑडियो इनपुट संभालते समय मॉडल-विशिष्ट दस्तावेज़ देखें.

कौन-सी स्ट्रीमिंग विधियाँ उपलब्ध हैं?

आपके उपयोग के मामले और इस बात पर निर्भर करते हुए कि आप पहले से पूरी हो चुकी ऑडियो रिकॉर्डिंग को ट्रांसक्राइब करना चाहते हैं या ऑडियो की जारी स्ट्रीम को संभालना चाहते हैं और बारी का पता लगाने के लिए OpenAI का उपयोग करना चाहते हैं, आपके ट्रांसक्रिप्शन को स्ट्रीम करने के दो तरीके हैं:

ध्यान दें कि whisper-1 मॉडल के साथ स्ट्रीमिंग समर्थित नहीं है.

कौन-से फ़ाइल फ़ॉर्मैट समर्थित हैं?

समर्थित फ़ाइल फ़ॉर्मैट हमारे API दस्तावेज़ों में शामिल हैं.

क्या मैं ऑडियो फ़ाइलों के लिंक ऑडियो API को भेज सकता/सकती हूँ?

नहीं, आपको समर्थित ऑडियो फ़ॉर्मैट में से किसी एक में फ़ाइल भेजनी होगी.

Audio API के सामान्य प्रश्न

क्या यह लेख मददगार था?