Επισκόπηση
Ο έλεγχος του μήκους της απόκρισης ενός μοντέλου είναι χρήσιμος για διάφορους λόγους: βοηθά στη διαχείριση του κόστους (αφού πληρώνετε ανά token), βελτιώνει την καθυστέρηση/απόδοση (οι συντομότερες αποκρίσεις επιστρέφονται ταχύτερα) και διασφαλίζει τη συνάφεια αποφεύγοντας υπερβολικά μακροσκελείς ή φλύαρες εξόδους.
Μπορείτε να το πετύχετε αυτό χρησιμοποιώντας ανώτατα όρια token, ρυθμίσεις συλλογιστικής και λεπτομέρειας, σαφείς οδηγίες, παραδείγματα και ακολουθίες stop. Για τις πιο πρόσφατες και πλήρεις λεπτομέρειες, να ανατρέχετε πάντα στην επίσημη αναφορά API στο platform.openai.com.
Ορίστε μέγιστο μήκος εξόδου
Responses API
Χρησιμοποιείται για μοντέλα GPT-5 και για τα περισσότερα μοντέλα της σειράς o: χρησιμοποιήστε το max_output_tokens για να θέσετε ανώτατο όριο στον αριθμό των token που θα δημιουργήσει το μοντέλο. Υποστηρίζει stop, αλλά δεν υποστηρίζει πολλαπλές ολοκληρώσεις (n).
Chat Completions API
Χρησιμοποιείται για τα παλαιότερα GPT-3.5, GPT-4o και μερικές φορές για τη σειρά o.
Για μοντέλα συλλογιστικής όπως τα o3 και o4-mini, χρησιμοποιήστε το
max_completion_tokens(ψευδώνυμο τουmax_tokens)Για παλαιότερα/μη μοντέλα συλλογιστικής, το
max_tokensεξακολουθεί να λειτουργείΥποστηρίζει
stopκαιn(πολλαπλές ολοκληρώσεις).
Σημείωση: Δεν υπάρχει ρύθμιση «ελάχιστων tokens». Αν χρειάζεστε ελάχιστο μήκος, καθορίστε το στην προτροπή σας.
Όρια token ανά ομάδα μοντέλων
Για ενημερωμένα όρια token, μεγέθη πλαισίου και ανώτατα όρια εξόδου, ανατρέξτε στην τεκμηρίωση του συγκεκριμένου μοντέλου.
Γρήγορα παραδείγματα
Responses API
{ "model": "gpt-5", "input": "Σύνοψε τα ευρήματα σε ~80 λέξεις.", "max_output_tokens": 120 }Chat Completions (μοντέλο συλλογιστικής)
{ "model": "o3-mini", "messages": [{"role": "user", "content": "Write five one-line options."}], "max_completion_tokens": 100 }Ειδικά στοιχεία ελέγχου για μοντέλα GPT-5: verbosity και reasoning.effort
Αυτά τα στοιχεία ελέγχου είναι διαθέσιμα μόνο στα μοντέλα GPT-5 (gpt-5.2, gpt-5.2-chat-latest, gpt-5.2 pro κ.λπ. Τα μοντέλα της σειράς o και τα παλαιότερα μοντέλα δεν τα υποστηρίζουν.
verbosity δέχεται τις τιμές "low", "medium" (προεπιλογή) ή "high". Επηρεάζει το επίπεδο λεπτομέρειας αλλά όχι αυστηρά όρια.
{ "model": "gpt-5", "input": "Εξήγησε το PageRank σε υψηλό επίπεδο.", "text": { "verbosity": "low" }, "max_output_tokens": 200 }reasoning.effort ελέγχει πόσα tokens συλλογιστικής δημιουργούνται πριν παραχθεί μια απάντηση. Το GPT-5.2 υποστηρίζει none,low, medium, high,and xhigh. Το gpt-5.2-pro υποστηρίζει μόνο medium, high,and xhigh. Τα παλαιότερα μοντέλα συλλογιστικής υποστηρίζουν μόνο low, medium και high.
{ "model": "gpt-5", "input": "Πόσο χρυσό θα χρειαζόταν για να καλυφθεί το Άγαλμα της Ελευθερίας με στρώμα 1 mm;", "reasoning": { "effort": "minimal" } }Μπορείτε να ορίσετε το reasoning.effort σε none ώστε το μοντέλο να συμπεριφέρεται σαν μοντέλο χωρίς συλλογιστική για περιπτώσεις χρήσης ευαίσθητες στην καθυστέρηση.
Δώστε συγκεκριμένες οδηγίες
Ζητήστε το ακριβές μήκος ή σχήμα που θέλετε. Παραδείγματα:
«Παραθέστε ακριβώς πέντε επιλογές.»
«Γράψτε μια σύνοψη 50 λέξεων.»
«Όχι περισσότερα από 100 tokens. Αν χρειάζεστε περισσότερα, πείτε “Χρειάζομαι περισσότερο χώρο.”»
Χρησιμοποιήστε παραδείγματα με συνεπές μήκος
Παραδείγματα με λίγα παραδείγματα (few-shot) που ταιριάζουν με το επιθυμητό μήκος σας βοηθούν το μοντέλο να συνεχίσει το μοτίβο.
Εφαρμόστε στρατηγικές ακολουθίες stop
Χρησιμοποιήστε το stop για να σταματήσετε τη δημιουργία όταν το μοντέλο φτάσει σε έναν οριοθέτη ή σε ένα όριο αριθμημένης λίστας.
{ "stop": ["
###", "6."] }Πολλαπλοί υποψήφιοι
Chat Completions: το
nεπιστρέφει πολλαπλές ολοκληρώσεις σε μία κλήση.Responses API: το
nδεν υποστηρίζεται· κάντε πολλαπλές κλήσεις αν χρειάζεστε περισσότερες από μία εξόδους.
