সংক্ষিপ্ত বিবরণ
মডেলের প্রতিক্রিয়ার দৈর্ঘ্য নিয়ন্ত্রণ করা কয়েকটি কারণে উপকারী: এটি খরচ পরিচালনায় সাহায্য করে (কারণ আপনি প্রতি টোকেন অনুযায়ী অর্থ দেন), ল্যাটেন্সি/পারফরম্যান্স উন্নত করে (ছোট প্রতিক্রিয়া দ্রুত ফেরত আসে), এবং অতিরিক্ত দীর্ঘ বা বেশি কথাবহুল আউটপুট এড়িয়ে প্রাসঙ্গিকতা নিশ্চিত করে.
আপনি টোকেন ক্যাপ, reasoning ও verbosity সেটিংস, স্পষ্ট নির্দেশনা, উদাহরণ এবং স্টপ সিকোয়েন্স ব্যবহার করে এটি করতে পারেন. সবচেয়ে বর্তমান এবং পূর্ণাঙ্গ বিবরণের জন্য, সবসময় platform.openai.com-এর অফিসিয়াল API রেফারেন্স দেখুন.
সর্বোচ্চ আউটপুট দৈর্ঘ্য সেট করুন
রেসপন্সেস API
GPT-5 মডেল এবং বেশিরভাগ o-series মডেলের জন্য ব্যবহৃত হয়: মডেল কতগুলি টোকেন তৈরি করবে তা সীমাবদ্ধ করতে max_output_tokens ব্যবহার করুন. compaction_trigger অনুরোধের জন্য, max_output_tokens বাদ দিন অথবা এটি অন্তত 20000 সেট করুন; এর চেয়ে ছোট মান প্রত্যাখ্যান করা হয়. রেসপন্সেস API একাধিক কমপ্লিশন (n) সমর্থন করে না.
চ্যাট কমপ্লিশন্স API
লেগ্যাসি GPT-3.5, GPT-4o, এবং কখনও কখনও o-series-এর জন্য ব্যবহৃত হয়.
o3 এবং o4-mini-এর মতো reasoning মডেলের জন্য,
max_completion_tokensব্যবহার করুন (max_tokens-এর alias).আগের/non-reasoning মডেলের জন্য,
max_tokensএখনও কাজ করে.stopএবংn(একাধিক কমপ্লিশন) সমর্থন করে.
নোট: “ন্যূনতম টোকেন” নামে কোনো সেটিং নেই. আপনার যদি ন্যূনতম দৈর্ঘ্য দরকার হয়, তা আপনার প্রম্পটে উল্লেখ করুন.
মডেল গ্রুপ অনুযায়ী টোকেন সীমা
হালনাগাদ টোকেন সীমা, প্রসঙ্গের আকার এবং আউটপুট ক্যাপের জন্য, অনুগ্রহ করে নির্দিষ্ট মডেল ডকুমেন্টেশন দেখুন.
দ্রুত উদাহরণ
রেসপন্সেস API
{ "model": "gpt-5", "input": "ফলাফলগুলো প্রায় 80 শব্দে সংক্ষেপ করুন.", "max_output_tokens": 120 }চ্যাট কমপ্লিশন্স (reasoning মডেল)
{ "model": "o3-mini", "messages": [{"role": "user", "content": "Write five one-line options."}], "max_completion_tokens": 100 }GPT-5 মডেলের নির্দিষ্ট কন্ট্রোল: verbosity এবং reasoning.effort
এই কন্ট্রোলগুলি শুধু GPT-5 মডেলে উপলভ্য (gpt-5.2, gpt-5.2-chat-latest, gpt-5.2 pro, ইত্যাদি)। O-series এবং লেগ্যাসি মডেল এগুলি সমর্থন করে না.
`verbosity` "low", "medium" (ডিফল্ট), অথবা "high" গ্রহণ করে. এটি বিস্তারিতের মাত্রাকে প্রভাবিত করে, কিন্তু কঠোর সীমা নয়.
{ "model": "gpt-5", "input": "উচ্চ স্তরে PageRank ব্যাখ্যা করুন.", "text": { "verbosity": "low" }, "max_output_tokens": 200 }`reasoning.effort` উত্তর তৈরি করার আগে কতগুলি reasoning টোকেন তৈরি হবে তা নিয়ন্ত্রণ করে. GPT-5.2 none,low, medium, high,and xhigh সমর্থন করে. gpt-5.2-pro শুধু medium, high,and xhigh সমর্থন করে. আগের reasoning মডেলগুলি শুধু low, medium, এবং high সমর্থন করে.
{ "model": "gpt-5", "input": "স্ট্যাচু অব লিবার্টিকে 1mm স্তরে আবৃত করতে কতটা সোনা লাগবে?", "reasoning": { "effort": "minimal" } }ল্যাটেন্সি-সংবেদনশীল ব্যবহারের ক্ষেত্রে মডেলকে non-reasoning মডেলের মতো আচরণ করাতে আপনি `reasoning.effort` none সেট করতে পারেন.
নির্দিষ্ট নির্দেশনা দিন
আপনি যে সঠিক দৈর্ঘ্য বা গঠন চান তা বলুন. উদাহরণ:
“ঠিক পাঁচটি বিকল্প তালিকাভুক্ত করুন.”
“৫০-শব্দের একটি সারাংশ লিখুন.”
“১০০ টোকেনের বেশি নয়. আরও দরকার হলে বলুন, ‘আরও জায়গা দরকার.’”
সামঞ্জস্যপূর্ণ দৈর্ঘ্যের উদাহরণ ব্যবহার করুন
আপনার কাঙ্ক্ষিত দৈর্ঘ্যের সঙ্গে মেলে এমন ফিউ-শট উদাহরণ মডেলকে প্যাটার্ন চালিয়ে যেতে সাহায্য করে.
কৌশলগত স্টপ সিকোয়েন্স প্রয়োগ করুন
মডেল কোনো ডিলিমিটার বা নম্বরযুক্ত তালিকার সীমানায় পৌঁছালে জেনারেশন থামাতে stop ব্যবহার করুন.
{ "stop": ["
###", "6."] }একাধিক প্রার্থী
চ্যাট কমপ্লিশন্স:
nএক কলেই একাধিক কমপ্লিশন ফেরত দেয়.রেসপন্সেস API:
nসমর্থিত নয়; একাধিক আউটপুট দরকার হলে একাধিক কল করুন.
