Genel bakış
Bir modelin yanıt uzunluğunu kontrol etmek birkaç nedenle yararlıdır: maliyeti yönetmeye yardımcı olur (çünkü token başına ödeme yaparsınız), gecikmeyi/performansı iyileştirir (daha kısa yanıtlar daha hızlı döner) ve aşırı uzun ya da gereksiz ayrıntılı çıktıları önleyerek ilgililiği sağlar.
Bunu token üst sınırları, akıl yürütme ve ayrıntı düzeyi ayarları, net yönergeler, örnekler ve durdurma dizileriyle yapabilirsiniz. En güncel ve eksiksiz ayrıntılar için her zaman platform.openai.com üzerindeki resmi API başvurusuna bakın.
Maksimum çıktı uzunluğu belirleme
Responses API
GPT-5 modelleri ve çoğu o-serisi model için kullanılır: modelin üreteceği token sayısını sınırlamak için max_output_tokens kullanın. stop'u destekler, ancak birden fazla tamamlamayı (n) desteklemez.
Sohbet Tamamlama API'si
Eski GPT-3.5, GPT-4o ve bazen o-serisi için kullanılır.
o3 ve o4-mini gibi akıl yürütme modelleri için
max_completion_tokenskullanın (max_tokenstakma adı)Daha eski/akıl yürütmeyen modeller için
max_tokenshâlâ çalışırstopven'i destekler (birden fazla tamamlama).
Not: “Minimum token” diye bir ayar yoktur. Minimum uzunluğa ihtiyacınız varsa bunu komutunuzda belirtin.
Model grubuna göre token sınırları
Güncel token sınırları, bağlam boyutları ve çıktı üst sınırları için lütfen ilgili model belgelerine bakın.
Hızlı örnekler
Responses API
{ "model": "gpt-5", "input": "Bulguları ~80 kelimede özetleyin.", "max_output_tokens": 120 }Sohbet Tamamlamaları (akıl yürütme modeli)
{ "model": "o3-mini", "messages": [{"role": "user", "content": "Write five one-line options."}], "max_completion_tokens": 100 }GPT-5 modellerine özgü denetimler: verbosity ve reasoning.effort
Bu denetimler yalnızca GPT-5 modellerinde kullanılabilir (gpt-5.2, gpt-5.2-chat-latest, gpt-5.2 pro vb.). O-serisi ve eski modeller bunları desteklemez.
verbosity, "low", "medium" (varsayılan) veya "high" kabul eder. Ayrıntı düzeyini etkiler ancak kesin sınırlar koymaz.
{ "model": "gpt-5", "input": "PageRank’i genel hatlarıyla açıklayın.", "text": { "verbosity": "low" }, "max_output_tokens": 200 }reasoning.effort, yanıt üretmeden önce kaç akıl yürütme token'ı oluşturulacağını denetler. GPT-5.2 none,low, medium, high,and xhigh destekler. gpt-5.2-pro yalnızca medium, high,and xhigh destekler. Daha eski akıl yürütme modelleri yalnızca low, medium ve high destekler.
{ "model": "gpt-5", "input": "Özgürlük Heykeli’ni 1 mm’lik bir katmanla kaplamak için ne kadar altın gerekir?", "reasoning": { "effort": "minimal" } }reasoning.effort'u, gecikmeye duyarlı kullanım durumları için modelin akıl yürütmeyen bir model gibi davranmasını sağlamak amacıyla none olarak ayarlayabilirsiniz.
Belirli yönergeler verin
İstediğiniz tam uzunluğu veya biçimi isteyin. Örnekler:
“Tam olarak beş seçenek listeleyin.”
“50 kelimelik bir özet yazın.”
“100 token'dan fazla olmasın. Daha fazlasına ihtiyacınız varsa ‘Daha fazla alana ihtiyaç var.’ deyin.”
Tutarlı uzunlukta örnekler kullanın
İstediğiniz uzunluğa uyan az örnekli örnekler, modelin örüntüyü sürdürmesine yardımcı olur.
Stratejik durdurma dizileri uygulayın
Model bir ayıraca veya numaralı liste sınırına ulaştığında üretimi durdurmak için stop kullanın.
{ "stop": ["
###", "6."] }Birden fazla aday
Sohbet Tamamlamaları:
n, tek çağrıda birden fazla tamamlama döndürür.Responses API:
ndesteklenmez; birden fazla çıktıya ihtiyacınız varsa birden fazla çağrı yapın.
