Token ayarları, net prompt’lar, örnekler ve stop dizileriyle OpenAI modelleri için çıktı sınırlarını nasıl ayarlayacağınızı öğrenin.

Genel bakış

Bir modelin yanıt uzunluğunu kontrol etmek birkaç nedenle yararlıdır: maliyeti yönetmeye yardımcı olur (çünkü token başına ödeme yaparsınız), gecikmeyi/performansı iyileştirir (daha kısa yanıtlar daha hızlı döner) ve aşırı uzun veya ayrıntılı çıktılardan kaçınarak alaka düzeyini korur.

Bunu token üst limitleri, akıl yürütme ve ayrıntı ayarları, net talimatlar, örnekler ve stop dizileri kullanarak yapabilirsiniz. En güncel ve eksiksiz ayrıntılar için her zaman platform.openai.com’daki resmi API başvurusuna bakın.

Maksimum çıktı uzunluğu ayarlayın

Responses API

GPT-5 modelleri ve çoğu o serisi model için kullanılır: modelin üreteceği token sayısını sınırlamak için max_output_tokens kullanın. compaction_trigger istekleri için max_output_tokens değerini ya atlayın ya da en az 20000 olarak ayarlayın; daha küçük değerler reddedilir. Responses API birden çok completion’ı (n) desteklemez.

Chat Completions API

Eski GPT-3.5, GPT-4o ve bazen o serisi için kullanılır.

o3 ve o4-mini gibi akıl yürütme modelleri için max_completion_tokens kullanın (max_tokens diğer adı)
Daha eski/akıl yürütme modeli olmayan modeller için max_tokens hâlâ çalışır
stop ve n (birden çok completion) destekler.

Not: “Minimum token” ayarı yoktur. Minimum uzunluk gerekiyorsa bunu prompt’unuzda belirtin.

Model grubuna göre token sınırları

Güncel token sınırları, bağlam boyutları ve çıktı üst limitleri için lütfen ilgili model belgelerine bakın.

Hızlı örnekler

Responses API

{ "model": "gpt-5", "input": "Bulguları ~80 kelimeyle özetle.", "max_output_tokens": 120 }

Chat Completions (akıl yürütme modeli)

{ "model": "o3-mini", "messages": [{"role": "user", "content": "Write five one-line options."}], "max_completion_tokens": 100 }

GPT-5 modellerine özgü kontroller: `verbosity` ve `reasoning.effort`

Bu kontroller yalnızca GPT-5 modellerinde kullanılabilir (gpt-5.2, gpt-5.2-chat-latest, gpt-5.2 pro vb.). O serisi ve eski modeller bunları desteklemez.

`verbosity` "low", "medium" (varsayılan) veya "high" değerlerini kabul eder. Ayrıntı düzeyini etkiler, ancak kesin sınırları etkilemez.

{ "model": "gpt-5", "input": "PageRank’i genel hatlarıyla açıkla.", "text": { "verbosity": "low" }, "max_output_tokens": 200 }

`reasoning.effort`, yanıt üretmeden önce kaç akıl yürütme token’ı oluşturulacağını kontrol eder. GPT-5.2 none,low, medium, high,and xhigh değerlerini destekler. gpt-5.2-pro yalnızca medium, high,and xhigh değerlerini destekler. Daha eski akıl yürütme modelleri yalnızca low, medium ve high değerlerini destekler.

{ "model": "gpt-5", "input": "Özgürlük Heykeli’ni 1 mm’lik bir katmanla kaplamak için ne kadar altın gerekir?", "reasoning": { "effort": "minimal" } }

Gecikmeye duyarlı kullanım durumlarında modelin akıl yürütme modeli olmayan bir model gibi davranmasını sağlamak için `reasoning.effort` değerini none olarak ayarlayabilirsiniz.

Belirli talimatlar verin

İstediğiniz tam uzunluğu veya biçimi belirtin. Örnekler:

“Tam olarak beş seçenek listele.”
“50 kelimelik bir özet yaz.”
“En fazla 100 token. Daha fazlası gerekirse ‘Daha fazla alana ihtiyacım var.’ deyin.”

Tutarlı uzunlukta örnekler kullanın

İstediğiniz uzunlukla eşleşen az örnekli örnekler, modelin kalıbı sürdürmesine yardımcı olur.

Stratejik stop dizileri uygulayın

Model bir ayırıcıya veya numaralı liste sınırına ulaştığında üretimi durdurmak için stop kullanın.

{ "stop": ["\n###", "6."] }

Birden çok aday

Chat Completions: n, tek çağrıda birden çok completion döndürür.
Responses API: n desteklenmez; birden fazla çıktı gerekiyorsa birden çok çağrı yapın.

OpenAI model yanıtlarının uzunluğunu kontrol etme

Genel bakış

Maksimum çıktı uzunluğu ayarlayın

Responses API

Chat Completions API

Model grubuna göre token sınırları

Hızlı örnekler

GPT-5 modellerine özgü kontroller: `verbosity` ve `reasoning.effort`

Belirli talimatlar verin

Tutarlı uzunlukta örnekler kullanın

Stratejik stop dizileri uygulayın

Birden çok aday

Bu makale yararlı oldu mu?

OpenAI model yanıtlarının uzunluğunu kontrol etme

Genel bakış

Maksimum çıktı uzunluğu ayarlayın

Responses API

Chat Completions API

Model grubuna göre token sınırları

Hızlı örnekler

GPT-5 modellerine özgü kontroller: verbosity ve reasoning.effort

Belirli talimatlar verin

Tutarlı uzunlukta örnekler kullanın

Stratejik stop dizileri uygulayın

Birden çok aday

Bu makale yararlı oldu mu?

GPT-5 modellerine özgü kontroller: `verbosity` ve `reasoning.effort`