Áttekintés
Egy modell válaszhosszának szabályozása több okból is hasznos: segít kezelni a költségeket (mivel tokenenként fizet), javítja a késleltetést/teljesítményt (a rövidebb válaszok gyorsabban érkeznek meg), és biztosítja a relevanciát azáltal, hogy elkerüli a túl hosszú vagy bőbeszédű kimeneteket.
Ezt tokenkorlátokkal, érvelési és részletességi beállításokkal, egyértelmű utasításokkal, példákkal és leállítási szekvenciákkal érheti el. A legfrissebb és legteljesebb részletekért mindig tekintse meg a hivatalos API-referenciát a platform.openai.com webhelyen.
Állítson be maximális kimeneti hosszt
Responses API
GPT-5 modellekhez és a legtöbb o-sorozatú modellhez használatos: a max_output_tokens használatával korlátozhatja a modell által generált tokenek számát. compaction_trigger kérések esetén vagy hagyja ki a max_output_tokens értéket, vagy állítsa legalább 20000-re; a kisebb értékeket a rendszer elutasítja. A Responses API nem támogatja a több befejezést (n).
Csevegés-befejezési API
Régi GPT-3.5, GPT-4o és néha o-sorozatú modellekhez használatos.
Az olyan érvelési modellekhez, mint az o3 és az o4-mini, használja a
max_completion_tokensértéket (amax_tokensaliasa)A korábbi/nem érvelési modelleknél a
max_tokenstovábbra is működikTámogatja a
stopés aznértéket (több befejezés).
Megjegyzés: Nincs „minimális tokenszám” beállítás. Ha minimális hosszra van szüksége, adja meg az utasításban.
Tokenkorlátok modellcsoport szerint
A naprakész tokenkorlátokért, kontextusméretekért és kimeneti korlátokért tekintse meg az adott modell dokumentációját.
Gyors példák
Responses API
{ "model": "gpt-5", "input": "Foglald össze a megállapításokat kb. 80 szóban.", "max_output_tokens": 120 }Csevegés-befejezések (érvelési modell)
{ "model": "o3-mini", "messages": [{"role": "user", "content": "Write five one-line options."}], "max_completion_tokens": 100 }GPT-5 modellek specifikus vezérlői: verbosity és reasoning.effort
Ezek a vezérlők csak a GPT-5 modelleken érhetők el (gpt-5.2, gpt-5.2-chat-latest, gpt-5.2 pro stb.). Az O-sorozatú és a régi modellek nem támogatják őket.
A `verbosity` elfogadott értékei: "low", "medium" (alapértelmezett) vagy "high". Befolyásolja a részletesség szintjét, de nem a szigorú korlátokat.
{ "model": "gpt-5", "input": "Magyarázd el magas szinten a PageRanket.", "text": { "verbosity": "low" }, "max_output_tokens": 200 }A `reasoning.effort` szabályozza, hány érvelési token generálódik a válasz elkészítése előtt. A GPT-5.2 támogatja a következőket: none,low, medium, high,and xhigh. A gpt-5.2-pro csak a következőket támogatja: medium, high,and xhigh. A korábbi érvelési modellek csak a low, medium és high értékeket támogatják.
{ "model": "gpt-5", "input": "Mennyi arany kellene a Szabadság-szobor 1 mm-es bevonásához?", "reasoning": { "effort": "minimal" } }A `reasoning.effort` értékét none-ra állíthatja, hogy a modell nem érvelési modellként viselkedjen a késleltetésre érzékeny használati esetekben.
Adjon meg konkrét utasításokat
Kérje a kívánt pontos hosszt vagy formát. Példák:
„Soroljon fel pontosan öt lehetőséget.”
„Írjon 50 szavas összefoglalót.”
„Legfeljebb 100 token. Ha többre van szüksége, írja: „Több hely kell.””
Használjon egységes hosszúságú példákat
A kívánt hosszúsághoz illeszkedő kevés lövéses példák segítenek a modellnek folytatni a mintát.
Alkalmazzon stratégiai leállítási szekvenciákat
A stop használatával állítsa le a generálást, amikor a modell elér egy elválasztójelet vagy egy számozott lista határát.
{ "stop": ["
###", "6."] }Több jelölt
Csevegés-befejezések: a
ntöbb befejezést ad vissza egyetlen hívásban.Responses API: a
nnem támogatott; indítson több hívást, ha egynél több kimenetre van szüksége.
