OpenAI
Bu sayfanın çevirisi otomatik olarak yapılmıştır. Orijinal İngilizce makaleyi görüntüleyin.

OpenAI model yanıtlarının uzunluğunu kontrol etme

OpenAI modellerinde token ayarları, net komutlar, örnekler ve durdurma dizileriyle çıktı sınırları koymayı öğrenin.

Güncellenme zamanı: 11 days ago

Genel bakış

Bir modelin yanıt uzunluğunu kontrol etmek birkaç nedenle yararlıdır: maliyeti yönetmeye yardımcı olur (çünkü token başına ödeme yaparsınız), gecikmeyi/performansı iyileştirir (daha kısa yanıtlar daha hızlı döner) ve aşırı uzun ya da gereksiz ayrıntılı çıktıları önleyerek ilgililiği sağlar.

Bunu token üst sınırları, akıl yürütme ve ayrıntı düzeyi ayarları, net yönergeler, örnekler ve durdurma dizileriyle yapabilirsiniz. En güncel ve eksiksiz ayrıntılar için her zaman platform.openai.com üzerindeki resmi API başvurusuna bakın.

Maksimum çıktı uzunluğu belirleme

Responses API

GPT-5 modelleri ve çoğu o-serisi model için kullanılır: modelin üreteceği token sayısını sınırlamak için max_output_tokens kullanın. stop'u destekler, ancak birden fazla tamamlamayı (n) desteklemez.

Sohbet Tamamlama API'si

Eski GPT-3.5, GPT-4o ve bazen o-serisi için kullanılır.

  • o3 ve o4-mini gibi akıl yürütme modelleri için max_completion_tokens kullanın (max_tokens takma adı)

  • Daha eski/akıl yürütmeyen modeller için max_tokens hâlâ çalışır

  • stop ve n'i destekler (birden fazla tamamlama).

Not: “Minimum token” diye bir ayar yoktur. Minimum uzunluğa ihtiyacınız varsa bunu komutunuzda belirtin.

Model grubuna göre token sınırları

Güncel token sınırları, bağlam boyutları ve çıktı üst sınırları için lütfen ilgili model belgelerine bakın.

Hızlı örnekler

Responses API

{ "model": "gpt-5", "input": "Bulguları ~80 kelimede özetleyin.", "max_output_tokens": 120 }

Sohbet Tamamlamaları (akıl yürütme modeli)

{ "model": "o3-mini", "messages": [{"role": "user", "content": "Write five one-line options."}], "max_completion_tokens": 100 }

GPT-5 modellerine özgü denetimler: verbosity ve reasoning.effort

Bu denetimler yalnızca GPT-5 modellerinde kullanılabilir (gpt-5.2, gpt-5.2-chat-latest, gpt-5.2 pro vb.). O-serisi ve eski modeller bunları desteklemez.

verbosity, "low", "medium" (varsayılan) veya "high" kabul eder. Ayrıntı düzeyini etkiler ancak kesin sınırlar koymaz.

{ "model": "gpt-5", "input": "PageRank’i genel hatlarıyla açıklayın.", "text": { "verbosity": "low" }, "max_output_tokens": 200 }

reasoning.effort, yanıt üretmeden önce kaç akıl yürütme token'ı oluşturulacağını denetler. GPT-5.2 none,low, medium, high,and xhigh destekler. gpt-5.2-pro yalnızca medium, high,and xhigh destekler. Daha eski akıl yürütme modelleri yalnızca low, medium ve high destekler.

{ "model": "gpt-5", "input": "Özgürlük Heykeli’ni 1 mm’lik bir katmanla kaplamak için ne kadar altın gerekir?", "reasoning": { "effort": "minimal" } }

reasoning.effort'u, gecikmeye duyarlı kullanım durumları için modelin akıl yürütmeyen bir model gibi davranmasını sağlamak amacıyla none olarak ayarlayabilirsiniz.

Belirli yönergeler verin

İstediğiniz tam uzunluğu veya biçimi isteyin. Örnekler:

  • “Tam olarak beş seçenek listeleyin.”

  • 50 kelimelik bir özet yazın.”

  • 100 token'dan fazla olmasın. Daha fazlasına ihtiyacınız varsa ‘Daha fazla alana ihtiyaç var.’ deyin.”

Tutarlı uzunlukta örnekler kullanın

İstediğiniz uzunluğa uyan az örnekli örnekler, modelin örüntüyü sürdürmesine yardımcı olur.

Stratejik durdurma dizileri uygulayın

Model bir ayıraca veya numaralı liste sınırına ulaştığında üretimi durdurmak için stop kullanın.

{ "stop": ["
###", "6."] }

Birden fazla aday

  • Sohbet Tamamlamaları: n, tek çağrıda birden fazla tamamlama döndürür.

  • Responses API: n desteklenmez; birden fazla çıktıya ihtiyacınız varsa birden fazla çağrı yapın.

Bu makale yararlı oldu mu?