Audio API FAQ

Whisper, স্পিচ টু টেক্সট, Audio API সম্পর্কে সাধারণ প্রশ্ন

অডিও API দুটি স্পিচ-টু-টেক্সট এন্ডপয়েন্ট সমর্থন করে:

transcriptions
translations

অডিও API দিয়ে শুরু করতে, অনুগ্রহ করে আমাদের স্পিচ-টু-টেক্সট ডেভেলপার ডকুমেন্টেশন পড়ুন.

অডিও API ব্যবহার করতে কত খরচ হয়?

বিস্তারিত জানতে আমাদের মূল্য নির্ধারণ পৃষ্ঠা দেখুন.

কোন কোন ভাষা সমর্থিত?

সমর্থিত ভাষার তালিকা এখানে দেখুন.

বড় অডিও ফাইল কীভাবে সামলানো যায়?

লিগেসি/whisper-1 অডিও API ট্রান্সক্রিপশন আপলোডের জন্য, সর্বোচ্চ অনুরোধের আকার 25 MiB. নতুন gpt-4o ট্রান্সক্রিপশন রুটগুলো ভিন্ন ভ্যালিডেশন ব্যবহার করতে পারে, যেমন সময়কাল বা টোকেন সীমা, তাই ব্যবহারকারীদের দীর্ঘ অডিও ইনপুট সামলানোর সময় মডেল-নির্দিষ্ট ডকুমেন্টেশন দেখুন.

কোন কোন স্ট্রিমিং পদ্ধতি উপলভ্য?

আপনার ব্যবহারের ক্ষেত্র এবং আপনি ইতিমধ্যে সম্পন্ন হওয়া কোনো অডিও রেকর্ডিং ট্রান্সক্রাইব করতে চান, নাকি চলমান অডিও স্ট্রিম সামলে টার্ন শনাক্তকরণের জন্য OpenAI ব্যবহার করতে চান—এর ওপর নির্ভর করে আপনার ট্রান্সক্রিপশন স্ট্রিম করার দুটি উপায় আছে:

মনে রাখবেন, whisper-1 মডেলের সঙ্গে স্ট্রিমিং সমর্থিত নয়.

কোন কোন ফাইল ফরম্যাট সমর্থিত?

সমর্থিত ফাইল ফরম্যাটগুলো আমাদের API ডকুমেন্টেশনে অন্তর্ভুক্ত আছে.

আমি কি অডিও ফাইলের লিঙ্ক অডিও API-তে পাঠাতে পারি?

না, আপনাকে সমর্থিত অডিও ফরম্যাটগুলোর একটিতে একটি ফাইল পাঠাতে হবে.

এই নিবন্ধটি কি সহায়ক ছিল?