OpenAI
هذه الصفحة مترجمة باستخدام الترجمة الآلية. تفضل بالاطّلاع على المقال الأصلي بالإنجليزية.

التحكم في طول ردود نماذج OpenAI

تعرّف على كيفية تعيين حدود الإخراج لنماذج OpenAI باستخدام إعدادات الرموز والمطالبات الواضحة والأمثلة وتسلسلات الإيقاف.

تم التحديث: 6 days ago

نظرة عامة

يُعد التحكم في طول استجابة النموذج مفيدًا لعدة أسباب: فهو يساعد في إدارة التكلفة (لأنك تدفع مقابل كل رمز)، ويحسن زمن الاستجابة/الأداء (إذ تُعاد الردود الأقصر بسرعة أكبر)، ويضمن الملاءمة عبر تجنب المخرجات الطويلة أو المسهبة أكثر من اللازم.

يمكنك تحقيق ذلك باستخدام حدود الرموز وإعدادات الاستدلال والإسهاب، والتعليمات الواضحة، والأمثلة، وتسلسلات الإيقاف. للحصول على أحدث التفاصيل وأكثرها اكتمالًا، ارجع دائمًا إلى مرجع API الرسمي على platform.openai.com.

عيّن حدًا أقصى لطول الإخراج

واجهة برمجة تطبيقات Responses

تُستخدم لنماذج GPT-5 ومعظم نماذج سلسلة o: استخدم max_output_tokens لتحديد حد أقصى لعدد الرموز التي سيولّدها النموذج. بالنسبة إلى طلبات compaction_trigger، إما أن تحذف max_output_tokens أو تضبطه على 20000 على الأقل؛ إذ تُرفض القيم الأصغر. لا تدعم واجهة برمجة تطبيقات Responses الإكمالات المتعددة (n).

واجهة برمجة تطبيقات إكمال المحادثات

تُستخدم مع GPT-3.5 وGPT-4o القديمين، وأحيانًا مع سلسلة o.

  • بالنسبة إلى نماذج الاستدلال مثل o3 وo4-mini، استخدم max_completion_tokens (وهو اسم بديل لـ max_tokens)

  • بالنسبة إلى النماذج الأقدم/غير المخصصة للاستدلال، لا يزال max_tokens يعمل

  • تدعم stop وn (إكمالات متعددة).

ملاحظة: لا يوجد إعداد «حد أدنى للرموز». إذا كنت تحتاج إلى حد أدنى للطول، فحدده في مطالبتك.

حدود الرموز حسب مجموعة النماذج

للحصول على أحدث حدود الرموز وأحجام السياق وحدود الإخراج، يُرجى الرجوع إلى وثائق النموذج المحدد.

أمثلة سريعة

واجهة برمجة تطبيقات Responses

{ "model": "gpt-5", "input": "لخّص النتائج في نحو 80 كلمة.", "max_output_tokens": 120 }

إكمالات المحادثات (نموذج الاستدلال)

{ "model": "o3-mini", "messages": [{"role": "user", "content": "اكتب خمسة خيارات في سطر واحد."}], "max_completion_tokens": 100 }

عناصر تحكم خاصة بنماذج GPT-5: verbosity وreasoning.effort

عناصر التحكم هذه متاحة فقط في نماذج GPT-5 (gpt-5.2 وgpt-5.2-chat-latest وgpt-5.2 pro، إلخ. نماذج سلسلة O والنماذج القديمة لا تدعمها.

يقبل `verbosity` القيم "low" أو "medium" (افتراضيًا) أو "high". يؤثر في مستوى التفاصيل، لكنه لا يحدد حدودًا صارمة.

{ "model": "gpt-5", "input": "اشرح PageRank على مستوى عام.", "text": { "verbosity": "low" }, "max_output_tokens": 200 }

يتحكم `reasoning.effort` في عدد رموز الاستدلال التي يتم توليدها قبل إنتاج إجابة. يدعم GPT-5.2 القيم none,low وmedium وhigh,and xhigh. يدعم gpt-5.2-pro فقط القيم medium وhigh,and xhigh. تدعم نماذج الاستدلال الأقدم القيم low وmedium وhigh فقط.

{ "model": "gpt-5", "input": "ما مقدار الذهب اللازم لتغطية تمثال الحرية بطبقة بسماكة 1 مم؟", "reasoning": { "effort": "minimal" } }

يمكنك ضبط `reasoning.effort` على none لجعل النموذج يتصرف كنموذج غير مخصص للاستدلال في حالات الاستخدام الحساسة لزمن الاستجابة.

قدّم تعليمات محددة

اطلب الطول أو الشكل الدقيق الذي تريده. أمثلة:

  • «اذكر خمسة خيارات بالضبط.»

  • «اكتب ملخصًا من 50 كلمة

  • «لا تتجاوز 100 رمز. إذا احتجت إلى المزيد، فقل: ’أحتاج إلى مساحة أكبر.‘»

استخدم أمثلة ذات طول متسق

تساعد أمثلة قليلة الأمثلة التي تطابق الطول المطلوب النموذج على مواصلة النمط.

طبّق تسلسلات إيقاف استراتيجية

استخدم stop لإيقاف التوليد عندما يصل النموذج إلى محدِّد أو حدّ قائمة مرقّمة.

{ "stop": ["\n###", "6."] }

مرشحون متعددون

  • إكمالات المحادثات: يعيد n إكمالات متعددة في استدعاء واحد.

  • واجهة برمجة تطبيقات Responses: لا يكون n مدعومًا؛ أجرِ استدعاءات متعددة إذا كنت تحتاج إلى أكثر من مخرج واحد.

هل كانت هذه المقالة مفيدة؟