Áttekintés
Egy modell válasza hosszának szabályozása több okból is hasznos: segít kezelni a költségeket (mivel tokenenként fizet), javítja a késleltetést/teljesítményt (a rövidebb válaszok gyorsabban érkeznek vissza), és biztosítja a relevanciát azáltal, hogy elkerüli a túl hosszú vagy túl bőbeszédű kimeneteket.
Ezt tokenkorlátokkal, érvelési és részletességi beállításokkal, egyértelmű utasításokkal, példákkal és leállítási szekvenciákkal érheti el. A legfrissebb és legteljesebb részletekért mindig tekintse meg a hivatalos API-referenciát a platform.openai.com oldalon.
Maximális kimeneti hossz beállítása
Responses API
GPT-5 modellekhez és a legtöbb o-sorozatú modellhez használatos: a modell által generált tokenek számának korlátozásához használja a max_output_tokens beállítást. Támogatja a stop használatát, de nem támogatja a több befejezést (n).
csevegés-befejezési API
Régebbi GPT-3.5, GPT-4o és esetenként o-sorozatú modellekhez használatos.
Olyan érvelési modellekhez, mint az o3 és az o4-mini, használja a
max_completion_tokensértéket (amax_tokensaliasa)Korábbi/nem érvelési modelleknél a
max_tokenstovábbra is működikTámogatja a
stopés aznhasználatát (több befejezés).
Megjegyzés: Nincs „minimális tokenszám” beállítás. Ha minimális hosszra van szüksége, adja meg az utasításban.
Tokenkorlátok modellcsoportonként
A naprakész tokenkorlátokkal, kontextusméretekkel és kimeneti felső korlátokkal kapcsolatban kérjük, tekintse meg a konkrét modell dokumentációját.
Gyors példák
Responses API
{ "model": "gpt-5", "input": "Foglald össze a megállapításokat kb. 80 szóban.", "max_output_tokens": 120 }Chat Completions (érvelési modell)
{ "model": "o3-mini", "messages": [{"role": "user", "content": "Write five one-line options."}], "max_completion_tokens": 100 }A GPT-5 modellek speciális vezérlői: verbosity és reasoning.effort
Ezek a vezérlők csak GPT-5 modelleken érhetők el (gpt-5.2, gpt-5.2-chat-latest, gpt-5.2 pro stb. Az o-sorozatú és a régebbi modellek nem támogatják őket.
verbosity elfogadja a "low", "medium" (alapértelmezett) vagy "high" értéket. A részletesség szintjét befolyásolja, de nem jelent szigorú korlátot.
{ "model": "gpt-5", "input": "Magyarázd el magas szinten a PageRanket.", "text": { "verbosity": "low" }, "max_output_tokens": 200 }reasoning.effort szabályozza, hány érvelési token jön létre a válasz elkészítése előtt. A GPT-5.2 támogatja a none,low, medium, high,and xhigh értékeket. A gpt-5.2-pro csak a medium, high,and xhigh értékeket támogatja. A korábbi érvelési modellek csak a low, medium és high értékeket támogatják.
{ "model": "gpt-5", "input": "Mennyi arany kellene a Szabadság-szobor 1 mm-es bevonásához?", "reasoning": { "effort": "minimal" } }A reasoning.effort értékét beállíthatja none-ra, hogy a modell úgy viselkedjen, mint egy nem érvelési modell a késleltetésre érzékeny felhasználási esetekben.
Adjon konkrét utasításokat
Kérje pontosan azt a hosszúságot vagy formát, amelyet szeretne. Példák:
„Soroljon fel pontosan öt lehetőséget.”
„Írjon egy 50 szavas összefoglalót.”
„Legfeljebb 100 token. Ha többre van szüksége, mondja ezt: „Több hely kell.””
Használjon következetes hosszúságú példákat
A kívánt hosszhoz illeszkedő kevés lövéses példák segítenek a modellnek folytatni a mintát.
Alkalmazzon stratégiai leállítási szekvenciákat
Használja a stop beállítást a generálás leállítására, amikor a modell elér egy elválasztót vagy egy számozott lista határát.
{ "stop": ["
###", "6."] }Több jelölt
Chat Completions: az
negy hívásban több befejezést ad vissza.Responses API: az
nnem támogatott; végezzen több hívást, ha egynél több kimenetre van szüksége.
