OpenAI
এই পেজটি মেশিন দিয়ে অনুবাদ করা হয়েছে। মূল ইংরেজি আর্টিকেল দেখুন

OpenAI মডেলের রেসপন্সের দৈর্ঘ্য নিয়ন্ত্রণ

টোকেন সেটিংস, স্পষ্ট প্রম্পট, উদাহরণ ও stop sequence ব্যবহার করে OpenAI মডেলের আউটপুট সীমা সেট করা শিখুন.

আপডেট করা হয়েছে: yesterday

সংক্ষিপ্ত বিবরণ

মডেলের প্রতিক্রিয়ার দৈর্ঘ্য নিয়ন্ত্রণ করা কয়েকটি কারণে উপকারী: এটি খরচ পরিচালনায় সাহায্য করে (কারণ আপনি প্রতি টোকেন অনুযায়ী অর্থ দেন), ল্যাটেন্সি/পারফরম্যান্স উন্নত করে (ছোট প্রতিক্রিয়া দ্রুত ফেরত আসে), এবং অতিরিক্ত দীর্ঘ বা বেশি কথাবহুল আউটপুট এড়িয়ে প্রাসঙ্গিকতা নিশ্চিত করে.

আপনি টোকেন ক্যাপ, reasoning ও verbosity সেটিংস, স্পষ্ট নির্দেশনা, উদাহরণ এবং স্টপ সিকোয়েন্স ব্যবহার করে এটি করতে পারেন. সবচেয়ে বর্তমান এবং পূর্ণাঙ্গ বিবরণের জন্য, সবসময় platform.openai.com-এর অফিসিয়াল API রেফারেন্স দেখুন.

সর্বোচ্চ আউটপুট দৈর্ঘ্য সেট করুন

রেসপন্সেস API

GPT-5 মডেল এবং বেশিরভাগ o-series মডেলের জন্য ব্যবহৃত হয়: মডেল কতগুলি টোকেন তৈরি করবে তা সীমাবদ্ধ করতে max_output_tokens ব্যবহার করুন. compaction_trigger অনুরোধের জন্য, max_output_tokens বাদ দিন অথবা এটি অন্তত 20000 সেট করুন; এর চেয়ে ছোট মান প্রত্যাখ্যান করা হয়. রেসপন্সেস API একাধিক কমপ্লিশন (n) সমর্থন করে না.

চ্যাট কমপ্লিশন্স API

লেগ্যাসি GPT-3.5, GPT-4o, এবং কখনও কখনও o-series-এর জন্য ব্যবহৃত হয়.

  • o3 এবং o4-mini-এর মতো reasoning মডেলের জন্য, max_completion_tokens ব্যবহার করুন (max_tokens-এর alias).

  • আগের/non-reasoning মডেলের জন্য, max_tokens এখনও কাজ করে.

  • stop এবং n (একাধিক কমপ্লিশন) সমর্থন করে.

নোট: “ন্যূনতম টোকেন” নামে কোনো সেটিং নেই. আপনার যদি ন্যূনতম দৈর্ঘ্য দরকার হয়, তা আপনার প্রম্পটে উল্লেখ করুন.

মডেল গ্রুপ অনুযায়ী টোকেন সীমা

হালনাগাদ টোকেন সীমা, প্রসঙ্গের আকার এবং আউটপুট ক্যাপের জন্য, অনুগ্রহ করে নির্দিষ্ট মডেল ডকুমেন্টেশন দেখুন.

দ্রুত উদাহরণ

রেসপন্সেস API

{ "model": "gpt-5", "input": "ফলাফলগুলো প্রায় 80 শব্দে সংক্ষেপ করুন.", "max_output_tokens": 120 }

চ্যাট কমপ্লিশন্স (reasoning মডেল)

{ "model": "o3-mini", "messages": [{"role": "user", "content": "Write five one-line options."}], "max_completion_tokens": 100 }

GPT-5 মডেলের নির্দিষ্ট কন্ট্রোল: verbosity এবং reasoning.effort

এই কন্ট্রোলগুলি শুধু GPT-5 মডেলে উপলভ্য (gpt-5.2, gpt-5.2-chat-latest, gpt-5.2 pro, ইত্যাদি)। O-series এবং লেগ্যাসি মডেল এগুলি সমর্থন করে না.

`verbosity` "low", "medium" (ডিফল্ট), অথবা "high" গ্রহণ করে. এটি বিস্তারিতের মাত্রাকে প্রভাবিত করে, কিন্তু কঠোর সীমা নয়.

{ "model": "gpt-5", "input": "উচ্চ স্তরে PageRank ব্যাখ্যা করুন.", "text": { "verbosity": "low" }, "max_output_tokens": 200 }

`reasoning.effort` উত্তর তৈরি করার আগে কতগুলি reasoning টোকেন তৈরি হবে তা নিয়ন্ত্রণ করে. GPT-5.2 none,low, medium, high,and xhigh সমর্থন করে. gpt-5.2-pro শুধু medium, high,and xhigh সমর্থন করে. আগের reasoning মডেলগুলি শুধু low, medium, এবং high সমর্থন করে.

{ "model": "gpt-5", "input": "স্ট্যাচু অব লিবার্টিকে 1mm স্তরে আবৃত করতে কতটা সোনা লাগবে?", "reasoning": { "effort": "minimal" } }

ল্যাটেন্সি-সংবেদনশীল ব্যবহারের ক্ষেত্রে মডেলকে non-reasoning মডেলের মতো আচরণ করাতে আপনি `reasoning.effort` none সেট করতে পারেন.

নির্দিষ্ট নির্দেশনা দিন

আপনি যে সঠিক দৈর্ঘ্য বা গঠন চান তা বলুন. উদাহরণ:

  • ঠিক পাঁচটি বিকল্প তালিকাভুক্ত করুন.”

  • ৫০-শব্দের একটি সারাংশ লিখুন.”

  • ১০০ টোকেনের বেশি নয়. আরও দরকার হলে বলুন, ‘আরও জায়গা দরকার.’”

সামঞ্জস্যপূর্ণ দৈর্ঘ্যের উদাহরণ ব্যবহার করুন

আপনার কাঙ্ক্ষিত দৈর্ঘ্যের সঙ্গে মেলে এমন ফিউ-শট উদাহরণ মডেলকে প্যাটার্ন চালিয়ে যেতে সাহায্য করে.

কৌশলগত স্টপ সিকোয়েন্স প্রয়োগ করুন

মডেল কোনো ডিলিমিটার বা নম্বরযুক্ত তালিকার সীমানায় পৌঁছালে জেনারেশন থামাতে stop ব্যবহার করুন.

{ "stop": ["
###", "6."] }

একাধিক প্রার্থী

  • চ্যাট কমপ্লিশন্স: n এক কলেই একাধিক কমপ্লিশন ফেরত দেয়.

  • রেসপন্সেস API: n সমর্থিত নয়; একাধিক আউটপুট দরকার হলে একাধিক কল করুন.

এই নিবন্ধটি কি সহায়ক ছিল?