টোকেন সেটিংস, স্পষ্ট প্রম্পট, উদাহরণ ও stop sequence ব্যবহার করে OpenAI মডেলের আউটপুট সীমা সেট করা শিখুন.

সংক্ষিপ্ত বিবরণ

মডেলের প্রতিক্রিয়ার দৈর্ঘ্য নিয়ন্ত্রণ করা কয়েকটি কারণে উপকারী: এটি খরচ পরিচালনায় সাহায্য করে (কারণ আপনি প্রতি টোকেন অনুযায়ী অর্থ দেন), ল্যাটেন্সি/পারফরম্যান্স উন্নত করে (ছোট প্রতিক্রিয়া দ্রুত ফেরত আসে), এবং অতিরিক্ত দীর্ঘ বা বেশি কথাবহুল আউটপুট এড়িয়ে প্রাসঙ্গিকতা নিশ্চিত করে.

আপনি টোকেন ক্যাপ, reasoning ও verbosity সেটিংস, স্পষ্ট নির্দেশনা, উদাহরণ এবং স্টপ সিকোয়েন্স ব্যবহার করে এটি করতে পারেন. সবচেয়ে বর্তমান এবং পূর্ণাঙ্গ বিবরণের জন্য, সবসময় platform.openai.com-এর অফিসিয়াল API রেফারেন্স দেখুন.

সর্বোচ্চ আউটপুট দৈর্ঘ্য সেট করুন

রেসপন্সেস API

GPT-5 মডেল এবং বেশিরভাগ o-series মডেলের জন্য ব্যবহৃত হয়: মডেল কতগুলি টোকেন তৈরি করবে তা সীমাবদ্ধ করতে max_output_tokens ব্যবহার করুন. compaction_trigger অনুরোধের জন্য, max_output_tokens বাদ দিন অথবা এটি অন্তত 20000 সেট করুন; এর চেয়ে ছোট মান প্রত্যাখ্যান করা হয়. রেসপন্সেস API একাধিক কমপ্লিশন (n) সমর্থন করে না.

চ্যাট কমপ্লিশন্স API

লেগ্যাসি GPT-3.5, GPT-4o, এবং কখনও কখনও o-series-এর জন্য ব্যবহৃত হয়.

o3 এবং o4-mini-এর মতো reasoning মডেলের জন্য, max_completion_tokens ব্যবহার করুন (max_tokens-এর alias).
আগের/non-reasoning মডেলের জন্য, max_tokens এখনও কাজ করে.
stop এবং n (একাধিক কমপ্লিশন) সমর্থন করে.

নোট: “ন্যূনতম টোকেন” নামে কোনো সেটিং নেই. আপনার যদি ন্যূনতম দৈর্ঘ্য দরকার হয়, তা আপনার প্রম্পটে উল্লেখ করুন.

মডেল গ্রুপ অনুযায়ী টোকেন সীমা

হালনাগাদ টোকেন সীমা, প্রসঙ্গের আকার এবং আউটপুট ক্যাপের জন্য, অনুগ্রহ করে নির্দিষ্ট মডেল ডকুমেন্টেশন দেখুন.

দ্রুত উদাহরণ

রেসপন্সেস API

{ "model": "gpt-5", "input": "ফলাফলগুলো প্রায় 80 শব্দে সংক্ষেপ করুন.", "max_output_tokens": 120 }

চ্যাট কমপ্লিশন্স (reasoning মডেল)

{ "model": "o3-mini", "messages": [{"role": "user", "content": "Write five one-line options."}], "max_completion_tokens": 100 }

GPT-5 মডেলের নির্দিষ্ট কন্ট্রোল: `verbosity` এবং `reasoning.effort`

এই কন্ট্রোলগুলি শুধু GPT-5 মডেলে উপলভ্য (gpt-5.2, gpt-5.2-chat-latest, gpt-5.2 pro, ইত্যাদি)। O-series এবং লেগ্যাসি মডেল এগুলি সমর্থন করে না.

`verbosity` "low", "medium" (ডিফল্ট), অথবা "high" গ্রহণ করে. এটি বিস্তারিতের মাত্রাকে প্রভাবিত করে, কিন্তু কঠোর সীমা নয়.

{ "model": "gpt-5", "input": "উচ্চ স্তরে PageRank ব্যাখ্যা করুন.", "text": { "verbosity": "low" }, "max_output_tokens": 200 }

`reasoning.effort` উত্তর তৈরি করার আগে কতগুলি reasoning টোকেন তৈরি হবে তা নিয়ন্ত্রণ করে. GPT-5.2 none,low, medium, high,and xhigh সমর্থন করে. gpt-5.2-pro শুধু medium, high,and xhigh সমর্থন করে. আগের reasoning মডেলগুলি শুধু low, medium, এবং high সমর্থন করে.

{ "model": "gpt-5", "input": "স্ট্যাচু অব লিবার্টিকে 1mm স্তরে আবৃত করতে কতটা সোনা লাগবে?", "reasoning": { "effort": "minimal" } }

ল্যাটেন্সি-সংবেদনশীল ব্যবহারের ক্ষেত্রে মডেলকে non-reasoning মডেলের মতো আচরণ করাতে আপনি `reasoning.effort` none সেট করতে পারেন.

নির্দিষ্ট নির্দেশনা দিন

আপনি যে সঠিক দৈর্ঘ্য বা গঠন চান তা বলুন. উদাহরণ:

“ঠিক পাঁচটি বিকল্প তালিকাভুক্ত করুন.”
“৫০-শব্দের একটি সারাংশ লিখুন.”
“১০০ টোকেনের বেশি নয়. আরও দরকার হলে বলুন, ‘আরও জায়গা দরকার.’”

সামঞ্জস্যপূর্ণ দৈর্ঘ্যের উদাহরণ ব্যবহার করুন

আপনার কাঙ্ক্ষিত দৈর্ঘ্যের সঙ্গে মেলে এমন ফিউ-শট উদাহরণ মডেলকে প্যাটার্ন চালিয়ে যেতে সাহায্য করে.

কৌশলগত স্টপ সিকোয়েন্স প্রয়োগ করুন

মডেল কোনো ডিলিমিটার বা নম্বরযুক্ত তালিকার সীমানায় পৌঁছালে জেনারেশন থামাতে stop ব্যবহার করুন.

{ "stop": ["
###", "6."] }

একাধিক প্রার্থী

চ্যাট কমপ্লিশন্স: n এক কলেই একাধিক কমপ্লিশন ফেরত দেয়.
রেসপন্সেস API: n সমর্থিত নয়; একাধিক আউটপুট দরকার হলে একাধিক কল করুন.

OpenAI মডেলের রেসপন্সের দৈর্ঘ্য নিয়ন্ত্রণ

সংক্ষিপ্ত বিবরণ

সর্বোচ্চ আউটপুট দৈর্ঘ্য সেট করুন

রেসপন্সেস API

চ্যাট কমপ্লিশন্স API

মডেল গ্রুপ অনুযায়ী টোকেন সীমা

দ্রুত উদাহরণ

GPT-5 মডেলের নির্দিষ্ট কন্ট্রোল: `verbosity` এবং `reasoning.effort`

নির্দিষ্ট নির্দেশনা দিন

সামঞ্জস্যপূর্ণ দৈর্ঘ্যের উদাহরণ ব্যবহার করুন

কৌশলগত স্টপ সিকোয়েন্স প্রয়োগ করুন

একাধিক প্রার্থী

এই নিবন্ধটি কি সহায়ক ছিল?

OpenAI মডেলের রেসপন্সের দৈর্ঘ্য নিয়ন্ত্রণ

সংক্ষিপ্ত বিবরণ

সর্বোচ্চ আউটপুট দৈর্ঘ্য সেট করুন

রেসপন্সেস API

চ্যাট কমপ্লিশন্স API

মডেল গ্রুপ অনুযায়ী টোকেন সীমা

দ্রুত উদাহরণ

GPT-5 মডেলের নির্দিষ্ট কন্ট্রোল: verbosity এবং reasoning.effort

নির্দিষ্ট নির্দেশনা দিন

সামঞ্জস্যপূর্ণ দৈর্ঘ্যের উদাহরণ ব্যবহার করুন

কৌশলগত স্টপ সিকোয়েন্স প্রয়োগ করুন

একাধিক প্রার্থী

এই নিবন্ধটি কি সহায়ক ছিল?

GPT-5 মডেলের নির্দিষ্ট কন্ট্রোল: `verbosity` এবং `reasoning.effort`