ऑडियो API दो वाणी-से-पाठ एंडपॉइंट का समर्थन करता है:
transcriptionstranslations
ऑडियो API के साथ शुरू करने के लिए, कृपया हमारा वाणी-से-पाठ डेवलपर दस्तावेज़ पढ़ें.
ऑडियो API का उपयोग करने की लागत कितनी है?
विवरण के लिए हमारा मूल्य निर्धारण पेज देखें.
कौन-सी भाषाएँ समर्थित हैं?
समर्थित भाषाओं की सूची यहाँ देखें.
हम बड़ी ऑडियो फ़ाइलों को कैसे संभाल सकते हैं?
लेगेसी/whisper-1 ऑडियो API ट्रांसक्रिप्शन अपलोड के लिए, अधिकतम अनुरोध आकार 25 MiB है. नए gpt-4o ट्रांसक्रिप्शन रूट अलग-अलग सत्यापन, जैसे अवधि या टोकन सीमाएँ, का उपयोग कर सकते हैं, इसलिए उपयोगकर्ताओं से लंबे ऑडियो इनपुट संभालते समय मॉडल-विशिष्ट दस्तावेज़ देखें.
कौन-सी स्ट्रीमिंग विधियाँ उपलब्ध हैं?
आपके उपयोग के मामले और इस बात पर निर्भर करते हुए कि आप पहले से पूरी हो चुकी ऑडियो रिकॉर्डिंग को ट्रांसक्राइब करना चाहते हैं या ऑडियो की जारी स्ट्रीम को संभालना चाहते हैं और बारी का पता लगाने के लिए OpenAI का उपयोग करना चाहते हैं, आपके ट्रांसक्रिप्शन को स्ट्रीम करने के दो तरीके हैं:
ध्यान दें कि whisper-1 मॉडल के साथ स्ट्रीमिंग समर्थित नहीं है.
कौन-से फ़ाइल फ़ॉर्मैट समर्थित हैं?
समर्थित फ़ाइल फ़ॉर्मैट हमारे API दस्तावेज़ों में शामिल हैं.
क्या मैं ऑडियो फ़ाइलों के लिंक ऑडियो API को भेज सकता/सकती हूँ?
नहीं, आपको समर्थित ऑडियो फ़ॉर्मैट में से किसी एक में फ़ाइल भेजनी होगी.
