Audio API दो स्पीच-टू-टेक्स्ट एंडपॉइंट का समर्थन करता है:
transcriptionstranslations
Audio API के साथ शुरुआत करने के लिए, कृपया हमारा स्पीच-टू-टेक्स्ट डेवलपर दस्तावेज़ पढ़ें.
Audio API का उपयोग करने की लागत कितनी है?
विवरण के लिए हमारा मूल्य निर्धारण पेज देखें.
कौन-कौन सी भाषाएँ समर्थित हैं?
समर्थित भाषाओं की सूची यहाँ देखें.
हम बड़ी ऑडियो फ़ाइलों को कैसे संभाल सकते हैं?
legacy/whisper-1 Audio API ट्रांसक्रिप्शन अपलोड के लिए, अधिकतम अनुरोध आकार 25 MiB है. नए gpt-4o ट्रांसक्रिप्शन रूट अलग सत्यापन का उपयोग कर सकते हैं, जैसे अवधि या टोकन सीमाएँ, इसलिए उपयोगकर्ताओं से लंबे ऑडियो इनपुट संभालते समय मॉडल-विशिष्ट दस्तावेज़ देखें.
कौन-सी स्ट्रीमिंग विधियाँ उपलब्ध हैं?
आपके उपयोग के मामले और इस बात के आधार पर कि आप पहले से पूरी हो चुकी ऑडियो रिकॉर्डिंग का ट्रांसक्रिप्शन करना चाहते हैं या चल रही ऑडियो स्ट्रीम को संभालकर टर्न डिटेक्शन के लिए OpenAI का उपयोग करना चाहते हैं, ट्रांसक्रिप्शन स्ट्रीम करने के दो तरीके हैं:
ध्यान दें कि whisper-1 मॉडल के साथ स्ट्रीमिंग समर्थित नहीं है.
कौन-से फ़ाइल फ़ॉर्मैट समर्थित हैं?
समर्थित फ़ाइल फ़ॉर्मैट हमारे API दस्तावेज़ों में शामिल हैं.
क्या मैं Audio API को ऑडियो फ़ाइलों के लिंक भेज सकता हूँ?
नहीं, आपको समर्थित ऑडियो फ़ॉर्मैट में से किसी एक में फ़ाइल भेजनी होगी.
