Μάθετε πώς να ορίζετε όρια εξόδου για μοντέλα OpenAI με ρυθμίσεις token, σαφείς προτροπές, παραδείγματα και ακολουθίες stop.

Επισκόπηση

Ο έλεγχος του μήκους της απόκρισης ενός μοντέλου είναι χρήσιμος για διάφορους λόγους: βοηθά στη διαχείριση του κόστους (αφού πληρώνετε ανά token), βελτιώνει την καθυστέρηση/απόδοση (οι συντομότερες αποκρίσεις επιστρέφονται πιο γρήγορα) και διασφαλίζει τη συνάφεια αποφεύγοντας υπερβολικά μεγάλες ή φλύαρες εξόδους.

Μπορείτε να το πετύχετε αυτό χρησιμοποιώντας ανώτατα όρια token, ρυθμίσεις συλλογιστικής και επιπέδου λεπτομέρειας, σαφείς οδηγίες, παραδείγματα και ακολουθίες διακοπής. Για τις πιο πρόσφατες και πλήρεις λεπτομέρειες, να ανατρέχετε πάντα στην επίσημη αναφορά API στο platform.openai.com.

Ορίστε μέγιστο μήκος εξόδου

Responses API

Χρησιμοποιείται για μοντέλα GPT-5 και τα περισσότερα μοντέλα της σειράς o: χρησιμοποιήστε το max_output_tokens για να περιορίσετε τον αριθμό των token που θα δημιουργήσει το μοντέλο. Για αιτήματα compaction_trigger, είτε παραλείψτε το max_output_tokens είτε ορίστε το τουλάχιστον σε 20000· οι μικρότερες τιμές απορρίπτονται. Το Responses API δεν υποστηρίζει πολλαπλές ολοκληρώσεις (n).

Chat Completions API

Χρησιμοποιείται για παλαιού τύπου GPT-3.5, GPT-4o και ορισμένες φορές για τη σειρά o.

Για μοντέλα συλλογιστικής όπως τα o3 και o4-mini, χρησιμοποιήστε το max_completion_tokens (ψευδώνυμο του max_tokens)
Για παλαιότερα/μη συλλογιστικά μοντέλα, το max_tokens εξακολουθεί να λειτουργεί
Υποστηρίζει τα stop και n (πολλαπλές ολοκληρώσεις).

Σημείωση: Δεν υπάρχει ρύθμιση «ελάχιστων tokens». Αν χρειάζεστε ελάχιστο μήκος, καθορίστε το στην προτροπή σας.

Όρια token ανά ομάδα μοντέλων

Για τα πιο πρόσφατα όρια token, μεγέθη περιβάλλοντος και ανώτατα όρια εξόδου, ανατρέξτε στην τεκμηρίωση του συγκεκριμένου μοντέλου.

Γρήγορα παραδείγματα

Responses API

{ "model": "gpt-5", "input": "Σύνοψε τα ευρήματα σε ~80 λέξεις.", "max_output_tokens": 120 }

Chat Completions (μοντέλο συλλογιστικής)

{ "model": "o3-mini", "messages": [{"role": "user", "content": "Write five one-line options."}], "max_completion_tokens": 100 }

Ειδικά στοιχεία ελέγχου των μοντέλων GPT-5: `verbosity` και `reasoning.effort`

Αυτά τα στοιχεία ελέγχου είναι διαθέσιμα μόνο στα μοντέλα GPT-5 (gpt-5.2, gpt-5.2-chat-latest, gpt-5.2 pro κ.λπ.). Τα μοντέλα της σειράς O και τα παλαιού τύπου μοντέλα δεν τα υποστηρίζουν.

Το `verbosity` δέχεται "low", "medium" (προεπιλογή) ή "high". Επηρεάζει το επίπεδο λεπτομέρειας, αλλά όχι τα αυστηρά όρια.

{ "model": "gpt-5", "input": "Εξήγησε το PageRank σε υψηλό επίπεδο.", "text": { "verbosity": "low" }, "max_output_tokens": 200 }

Το `reasoning.effort` ελέγχει πόσα token συλλογιστικής δημιουργούνται πριν παραχθεί μια απάντηση. Το GPT-5.2 υποστηρίζει none,low, medium, high,and xhigh. Το gpt-5.2-pro υποστηρίζει μόνο medium, high,and xhigh. Τα παλαιότερα μοντέλα συλλογιστικής υποστηρίζουν μόνο τα low, medium και high.

{ "model": "gpt-5", "input": "Πόσο χρυσό θα χρειαζόταν για να καλυφθεί το Άγαλμα της Ελευθερίας με στρώμα 1 mm;", "reasoning": { "effort": "minimal" } }

Μπορείτε να ορίσετε το `reasoning.effort` σε none, ώστε το μοντέλο να συμπεριφέρεται σαν μη συλλογιστικό μοντέλο για περιπτώσεις χρήσης που είναι ευαίσθητες στην καθυστέρηση.

Δώστε συγκεκριμένες οδηγίες

Ζητήστε το ακριβές μήκος ή τη μορφή που θέλετε. Παραδείγματα:

«Καταγράψτε ακριβώς πέντε επιλογές.»
«Γράψτε μια σύνοψη 50 λέξεων.»
«Όχι περισσότερα από 100 token. Αν χρειάζεστε περισσότερο χώρο, πείτε “Χρειάζομαι περισσότερο χώρο”.»

Χρησιμοποιήστε παραδείγματα με συνεπές μήκος

Τα παραδείγματα με λίγα παραδείγματα (few-shot) που ταιριάζουν με το επιθυμητό μήκος βοηθούν το μοντέλο να συνεχίσει το μοτίβο.

Εφαρμόστε στρατηγικές ακολουθίες διακοπής

Χρησιμοποιήστε το stop για να σταματά η δημιουργία όταν το μοντέλο φτάνει σε έναν οριοθέτη ή σε όριο αριθμημένης λίστας.

{ "stop": ["
###", "6."] }

Πολλαπλοί υποψήφιοι

Chat Completions: Το n επιστρέφει πολλαπλές ολοκληρώσεις σε μία κλήση.
Responses API: Το n δεν υποστηρίζεται· κάντε πολλαπλές κλήσεις αν χρειάζεστε περισσότερες από μία εξόδους.

Έλεγχος του μήκους των αποκρίσεων μοντέλων OpenAI

Επισκόπηση

Ορίστε μέγιστο μήκος εξόδου

Responses API

Chat Completions API

Όρια token ανά ομάδα μοντέλων

Γρήγορα παραδείγματα

Ειδικά στοιχεία ελέγχου των μοντέλων GPT-5: `verbosity` και `reasoning.effort`

Δώστε συγκεκριμένες οδηγίες

Χρησιμοποιήστε παραδείγματα με συνεπές μήκος

Εφαρμόστε στρατηγικές ακολουθίες διακοπής

Πολλαπλοί υποψήφιοι

Σας βοήθησε αυτό το άρθρο;

Έλεγχος του μήκους των αποκρίσεων μοντέλων OpenAI

Επισκόπηση

Ορίστε μέγιστο μήκος εξόδου

Responses API

Chat Completions API

Όρια token ανά ομάδα μοντέλων

Γρήγορα παραδείγματα

Ειδικά στοιχεία ελέγχου των μοντέλων GPT-5: verbosity και reasoning.effort

Δώστε συγκεκριμένες οδηγίες

Χρησιμοποιήστε παραδείγματα με συνεπές μήκος

Εφαρμόστε στρατηγικές ακολουθίες διακοπής

Πολλαπλοί υποψήφιοι

Σας βοήθησε αυτό το άρθρο;

Ειδικά στοιχεία ελέγχου των μοντέλων GPT-5: `verbosity` και `reasoning.effort`