OpenAI
Ez az oldal gépi fordítással készült. Tekintsd meg az eredeti angol nyelvű cikket.

Az OpenAI modellválaszok hosszának szabályozása

Ismerje meg, hogyan állíthat be kimeneti korlátokat az OpenAI modellekhez tokenbeállításokkal, egyértelmű utasításokkal, példákkal és leállítási szekvenciákkal.

Frissítve: 7 hours ago

Áttekintés

Egy modell válasza hosszának szabályozása több okból is hasznos: segít kezelni a költségeket (mivel tokenenként fizet), javítja a késleltetést/teljesítményt (a rövidebb válaszok gyorsabban érkeznek vissza), és biztosítja a relevanciát azáltal, hogy elkerüli a túl hosszú vagy túl bőbeszédű kimeneteket.

Ezt tokenkorlátokkal, érvelési és részletességi beállításokkal, egyértelmű utasításokkal, példákkal és leállítási szekvenciákkal érheti el. A legfrissebb és legteljesebb részletekért mindig tekintse meg a hivatalos API-referenciát a platform.openai.com oldalon.

Maximális kimeneti hossz beállítása

Responses API

GPT-5 modellekhez és a legtöbb o-sorozatú modellhez használatos: a modell által generált tokenek számának korlátozásához használja a max_output_tokens beállítást. Támogatja a stop használatát, de nem támogatja a több befejezést (n).

csevegés-befejezési API

Régebbi GPT-3.5, GPT-4o és esetenként o-sorozatú modellekhez használatos.

  • Olyan érvelési modellekhez, mint az o3 és az o4-mini, használja a max_completion_tokens értéket (a max_tokens aliasa)

  • Korábbi/nem érvelési modelleknél a max_tokens továbbra is működik

  • Támogatja a stop és az n használatát (több befejezés).

Megjegyzés: Nincs „minimális tokenszám” beállítás. Ha minimális hosszra van szüksége, adja meg az utasításban.

Tokenkorlátok modellcsoportonként

A naprakész tokenkorlátokkal, kontextusméretekkel és kimeneti felső korlátokkal kapcsolatban kérjük, tekintse meg a konkrét modell dokumentációját.

Gyors példák

Responses API

{ "model": "gpt-5", "input": "Foglald össze a megállapításokat kb. 80 szóban.", "max_output_tokens": 120 }

Chat Completions (érvelési modell)

{ "model": "o3-mini", "messages": [{"role": "user", "content": "Write five one-line options."}], "max_completion_tokens": 100 }

A GPT-5 modellek speciális vezérlői: verbosity és reasoning.effort

Ezek a vezérlők csak GPT-5 modelleken érhetők el (gpt-5.2, gpt-5.2-chat-latest, gpt-5.2 pro stb. Az o-sorozatú és a régebbi modellek nem támogatják őket.

verbosity elfogadja a "low", "medium" (alapértelmezett) vagy "high" értéket. A részletesség szintjét befolyásolja, de nem jelent szigorú korlátot.

{ "model": "gpt-5", "input": "Magyarázd el magas szinten a PageRanket.", "text": { "verbosity": "low" }, "max_output_tokens": 200 }

reasoning.effort szabályozza, hány érvelési token jön létre a válasz elkészítése előtt. A GPT-5.2 támogatja a none,low, medium, high,and xhigh értékeket. A gpt-5.2-pro csak a medium, high,and xhigh értékeket támogatja. A korábbi érvelési modellek csak a low, medium és high értékeket támogatják.

{ "model": "gpt-5", "input": "Mennyi arany kellene a Szabadság-szobor 1 mm-es bevonásához?", "reasoning": { "effort": "minimal" } }

A reasoning.effort értékét beállíthatja none-ra, hogy a modell úgy viselkedjen, mint egy nem érvelési modell a késleltetésre érzékeny felhasználási esetekben.

Adjon konkrét utasításokat

Kérje pontosan azt a hosszúságot vagy formát, amelyet szeretne. Példák:

  • „Soroljon fel pontosan öt lehetőséget.”

  • „Írjon egy 50 szavas összefoglalót.”

  • „Legfeljebb 100 token. Ha többre van szüksége, mondja ezt: „Több hely kell.””

Használjon következetes hosszúságú példákat

A kívánt hosszhoz illeszkedő kevés lövéses példák segítenek a modellnek folytatni a mintát.

Alkalmazzon stratégiai leállítási szekvenciákat

Használja a stop beállítást a generálás leállítására, amikor a modell elér egy elválasztót vagy egy számozott lista határát.

{ "stop": ["
###", "6."] }

Több jelölt

  • Chat Completions: az n egy hívásban több befejezést ad vissza.

  • Responses API: az n nem támogatott; végezzen több hívást, ha egynél több kimenetre van szüksége.

Hasznos volt ez a cikk?