OpenAI
यह पेज मशीन द्वारा अनुवादित है. मूल अंग्रेज़ी आर्टिकल देखें.

Audio API के सामान्य प्रश्न

Whisper, स्पीच-टू-टेक्स्ट और Audio API के बारे में सामान्य प्रश्न

अपडेट किया गया: 10 days ago

ऑडियो API दो वाणी-से-पाठ एंडपॉइंट का समर्थन करता है:

  • transcriptions

  • translations

ऑडियो API के साथ शुरू करने के लिए, कृपया हमारा वाणी-से-पाठ डेवलपर दस्तावेज़ पढ़ें.


ऑडियो API का उपयोग करने की लागत कितनी है?

विवरण के लिए हमारा मूल्य निर्धारण पेज देखें.


कौन-सी भाषाएँ समर्थित हैं?

समर्थित भाषाओं की सूची यहाँ देखें.


हम बड़ी ऑडियो फ़ाइलों को कैसे संभाल सकते हैं?

लेगेसी/whisper-1 ऑडियो API ट्रांसक्रिप्शन अपलोड के लिए, अधिकतम अनुरोध आकार 25 MiB है. नए gpt-4o ट्रांसक्रिप्शन रूट अलग-अलग सत्यापन, जैसे अवधि या टोकन सीमाएँ, का उपयोग कर सकते हैं, इसलिए उपयोगकर्ताओं से लंबे ऑडियो इनपुट संभालते समय मॉडल-विशिष्ट दस्तावेज़ देखें.


कौन-सी स्ट्रीमिंग विधियाँ उपलब्ध हैं?

आपके उपयोग के मामले और इस बात पर निर्भर करते हुए कि आप पहले से पूरी हो चुकी ऑडियो रिकॉर्डिंग को ट्रांसक्राइब करना चाहते हैं या ऑडियो की जारी स्ट्रीम को संभालना चाहते हैं और बारी का पता लगाने के लिए OpenAI का उपयोग करना चाहते हैं, आपके ट्रांसक्रिप्शन को स्ट्रीम करने के दो तरीके हैं:

ध्यान दें कि whisper-1 मॉडल के साथ स्ट्रीमिंग समर्थित नहीं है.

कौन-से फ़ाइल फ़ॉर्मैट समर्थित हैं?

समर्थित फ़ाइल फ़ॉर्मैट हमारे API दस्तावेज़ों में शामिल हैं.


क्या मैं ऑडियो फ़ाइलों के लिंक ऑडियो API को भेज सकता/सकती हूँ?

नहीं, आपको समर्थित ऑडियो फ़ॉर्मैट में से किसी एक में फ़ाइल भेजनी होगी.

क्या यह लेख मददगार था?