অডিও API দুটি স্পিচ-টু-টেক্সট এন্ডপয়েন্ট সমর্থন করে:
transcriptionstranslations
অডিও API দিয়ে শুরু করতে, অনুগ্রহ করে আমাদের স্পিচ-টু-টেক্সট ডেভেলপার ডকুমেন্টেশন পড়ুন.
অডিও API ব্যবহার করতে কত খরচ হয়?
বিস্তারিত জানতে আমাদের মূল্য নির্ধারণ পৃষ্ঠা দেখুন.
কোন কোন ভাষা সমর্থিত?
সমর্থিত ভাষার তালিকা এখানে দেখুন.
বড় অডিও ফাইল কীভাবে সামলানো যায়?
লিগেসি/whisper-1 অডিও API ট্রান্সক্রিপশন আপলোডের জন্য, সর্বোচ্চ অনুরোধের আকার 25 MiB. নতুন gpt-4o ট্রান্সক্রিপশন রুটগুলো ভিন্ন ভ্যালিডেশন ব্যবহার করতে পারে, যেমন সময়কাল বা টোকেন সীমা, তাই ব্যবহারকারীদের দীর্ঘ অডিও ইনপুট সামলানোর সময় মডেল-নির্দিষ্ট ডকুমেন্টেশন দেখুন.
কোন কোন স্ট্রিমিং পদ্ধতি উপলভ্য?
আপনার ব্যবহারের ক্ষেত্র এবং আপনি ইতিমধ্যে সম্পন্ন হওয়া কোনো অডিও রেকর্ডিং ট্রান্সক্রাইব করতে চান, নাকি চলমান অডিও স্ট্রিম সামলে টার্ন শনাক্তকরণের জন্য OpenAI ব্যবহার করতে চান—এর ওপর নির্ভর করে আপনার ট্রান্সক্রিপশন স্ট্রিম করার দুটি উপায় আছে:
মনে রাখবেন, whisper-1 মডেলের সঙ্গে স্ট্রিমিং সমর্থিত নয়.
কোন কোন ফাইল ফরম্যাট সমর্থিত?
সমর্থিত ফাইল ফরম্যাটগুলো আমাদের API ডকুমেন্টেশনে অন্তর্ভুক্ত আছে.
আমি কি অডিও ফাইলের লিঙ্ক অডিও API-তে পাঠাতে পারি?
না, আপনাকে সমর্থিত অডিও ফরম্যাটগুলোর একটিতে একটি ফাইল পাঠাতে হবে.
