Σημείωση: Αυτό το άρθρο παρέχει μια επισκόπηση υψηλού επιπέδου. Πληροφορίες για την τεχνική ρύθμιση μπορείτε να βρείτε στον ιστότοπο gpt-oss, στο GitHub, στο Hugging Face και στα OpenAI Cookbooks.
Επισκόπηση
Παρουσιάζουμε δύο μοντέλα συλλογιστικής ανοικτών βαρών: gpt‑oss‑120b και gpt‑oss‑20b. Εκτελούνται σε υποδομή που ελέγχετε ή μέσω παρόχων φιλοξενίας.
Σημείωση: Αυτά τα μοντέλα δεν παρέχονται μέσω του OpenAI API και δεν είναι διαθέσιμα στο ChatGPT.
Γιατί ανοικτά βάρη
Επιλογή και έλεγχος: Εκτελέστε μοντέλα on‑premises ή στο ιδιωτικό σας cloud, διατηρήστε τη γεωγραφική διαμονή δεδομένων και προσαρμόστε την απόδοση στις ανάγκες σας.
Προσαρμογή: Ρυθμίστε λεπτομερώς ή προσαρμόστε τα μοντέλα με τα ανοικτά εργαλεία που προτιμάτε.
Διαθεσιμότητα και αδειοδότηση
Άδεια: Η Apache 2.0 επιτρέπει ευρεία χρήση, τροποποίηση και αναδιανομή, συμπεριλαμβανομένης της εμπορικής χρήσης (σύμφωνα με την πολιτική χρήσης gpt-oss μας).
Παροχή: Δεν είναι διαθέσιμο μέσω του OpenAI API, επομένως δεν ισχύουν η τιμολόγηση API και τα όρια ρυθμού.
Συμβατότητα: Μπορεί να εκτελεστεί με κοινές ανοικτές στοίβες inference όπως vLLM, Ollama, llama.cpp, καθώς και σε cloud ή αυτοδιαχειριζόμενα περιβάλλοντα GPU.
Ξεκινώντας
Για να αποκτήσετε τα βάρη του μοντέλου και τους υποστηρικτικούς πόρους, μπορείτε να:
Επισκεφθείτε τον ιστότοπο gpt-oss για μια επισκόπηση και απευθείας συνδέσμους.
Κατεβάστε βάρη από τη συλλογή Hugging Face — έναν κόμβο κοινότητας όπου μπορείτε να βρείτε και τα δύο μοντέλα, να δείτε παραδείγματα χρήσης και προαιρετικά να εκτελέσετε inference απευθείας μέσω των υπηρεσιών του Hugging Face.
Αποκτήστε πρόσβαση στο αποθετήριο GitHub μας για κώδικα αναφοράς inference.
Χρησιμοποιήστε οδηγούς στο OpenAI Cookbook για ρύθμιση με υποστηριζόμενα runtime όπως Ollama, vLLM και Transformers. Το Cookbook περιλαμβάνει επίσης βήμα προς βήμα οδηγίες για τοπική εκτέλεση, χρήση κοινών runtime και—όπου υποστηρίζεται—λεπτομερή ρύθμιση μοντέλων gpt‑oss.
gpt‑oss‑safeguard (ερευνητική προεπισκόπηση)
Το gpt‑oss‑safeguard είναι ένα ζεύγος μοντέλων συλλογιστικής ασφάλειας ανοικτών βαρών που έχουν δημιουργηθεί πάνω στο gpt‑oss. Έχουν σχεδιαστεί για ταξινόμηση ασφάλειας βάσει πολιτικής και σχετικές εργασίες εμπιστοσύνης & ασφάλειας που εκτελείτε σε υποδομή που ελέγχετε. Όπως και άλλα μοντέλα gpt‑oss, αυτά τα βάρη δεν παρέχονται μέσω του OpenAI API ή του ChatGPT.
Μοντέλα μόνο κειμένου με σχήματα δομημένων αποτελεσμάτων αναφοράς (π.χ. απόφαση πολιτικής, αιτιολόγηση).
Φέρτε τη δική σας πολιτική: το μοντέλο ερμηνεύει τη γραπτή πολιτική σας ώστε να μπορεί να γενικεύει σε προϊόντα με ελάχιστη μηχανική εργασία.
Αποφάσεις με συλλογιστική: προαιρετικά ίχνη συλλογιστικής για βοήθεια στον εντοπισμό σφαλμάτων και στους ελέγχους (προορίζονται για προγραμματιστές και επαγγελματίες ασφάλειας, όχι για εμφάνιση σε τελικούς χρήστες).
Διαμορφώσιμη προσπάθεια συλλογιστικής: επιλέξτε χαμηλή / μεσαία / υψηλή για να εξισορροπήσετε την καθυστέρηση με το βάθος.
Άδεια: Apache 2.0 (δείτε την ενότητα Διαθεσιμότητα και αδειοδότηση παρακάτω).
Το gpt‑oss‑safeguard είναι κατάλληλο για φιλτράρισμα εισόδου/εξόδου για LLM, επισήμανση διαδικτυακού περιεχομένου και ροές εργασιών μαζικής επισήμανσης ή αξιολόγησης εκτός σύνδεσης. Για γενικές εφαρμογές (chat, πράκτορες κ.λπ.), συνιστούμε τα βασικά μοντέλα gpt‑oss.
Μπορείτε να προσαρμόσετε το σχήμα στις ανάγκες σας. Ανατρέξτε στο OpenAI Cookbook για οδηγούς σχετικά με τις προτροπές και για παραδείγματα.
Παραλλαγές μοντέλων & μεγέθη
| Μοντέλο | Προβλεπόμενη χρήση | Σημειώσεις | | gpt‑oss‑safeguard‑120b | Παραγωγή, συλλογιστική ασφάλειας υψηλής χωρητικότητας | 117B παράμετροι (≈5.1B ενεργές). Σχεδιασμένο να χωρά σε μία <br>GPU 80 GB<br> (π.χ. NVIDIA H100· εκτελείται επίσης σε GPU μεγαλύτερης μνήμης, όπως AMD MI300X). | | gpt‑oss‑safeguard‑20b | Χαμηλότερη καθυστέρηση / περιορισμένα περιβάλλοντα | 21B παράμετροι (≈3.6B ενεργές). |
Και τα δύο μοντέλα έχουν ρυθμιστεί λεπτομερώς από το gpt‑oss χωρίς αλλαγή αρχιτεκτονικής. Χρησιμοποιούν το ίδιο πρότυπο chat με το gpt‑oss· μπορείτε να διατηρήσετε την υπάρχουσα ρύθμισή σας. Ένα προτεινόμενο μοτίβο προτροπής είναι να τοποθετείτε την πολιτική σας σε μήνυμα προγραμματιστή και το περιεχόμενο προς αξιολόγηση σε μήνυμα χρήστη.
Υποστήριξη και κοινότητα
Οι αναπτύξεις ανοικτών βαρών είναι αυτοδιαχειριζόμενες και αυτοεξυπηρετούμενες. Δείτε πού μπορείτε να λάβετε υποστήριξη:
Ερωτήσεις, συζήτηση, συμβουλές: Χρησιμοποιήστε τις σελίδες μοντέλων του Hugging Face για να επικοινωνήσετε με την κοινότητα.
Αναπαραγώγιμα σφάλματα στον κώδικα αναφοράς inference της OpenAI: Ανοίξτε ένα issue στο αποθετήριο GitHub του gpt-oss.
Ζητήματα με runtime τρίτου μέρους (π.χ. vLLM, Ollama, llama.cpp): Χρησιμοποιήστε το σύστημα παρακολούθησης ζητημάτων, τα φόρουμ ή τη διαδικασία υποστήριξης του αντίστοιχου έργου.
Η OpenAI δεν παρέχει βοήθεια, πρακτική υλοποίηση ή υποστήριξη εντοπισμού σφαλμάτων για ρυθμίσεις, διαμορφώσεις, περιβάλλοντα ή εφαρμογές ανοικτών βαρών που φιλοξενούνται από εσάς ή από τρίτους.
Θα συνεχίσουμε να συνεργαζόμαστε με την κοινότητα για να βελτιώνουμε τα ανοικτά εργαλεία ασφάλειας, μεταξύ άλλων μέσω της ROOST Model Community (RMC). Η RMC φέρνει κοντά επαγγελματίες και ερευνητές ασφάλειας για να μοιράζονται βέλτιστες πρακτικές υλοποίησης μοντέλων TN ανοικτού κώδικα σε ροές εργασιών ασφάλειας, συμπεριλαμβανομένων αποτελεσμάτων αξιολόγησης και σχολίων για τα μοντέλα. Επισκεφθείτε το αποθετήριο GitHub της RMC για να μάθετε περισσότερα σχετικά με αυτήν τη συνεργασία και πώς να συμμετάσχετε.
Υποστήριξη και κοινότητα
Οι αναπτύξεις ανοικτών βαρών είναι αυτοδιαχειριζόμενες και αυτοεξυπηρετούμενες. Δείτε πού μπορείτε να λάβετε υποστήριξη:
Ερωτήσεις, συζήτηση, συμβουλές: Χρησιμοποιήστε τις σελίδες μοντέλων του Hugging Face για να επικοινωνήσετε με την κοινότητα.
Αναπαραγώγιμα σφάλματα στον κώδικα αναφοράς inference της OpenAI: Ανοίξτε ένα issue στο αποθετήριο GitHub του gpt-oss.
Ζητήματα με runtime τρίτου μέρους (π.χ. vLLM, Ollama, llama.cpp): Χρησιμοποιήστε το σύστημα παρακολούθησης ζητημάτων, τα φόρουμ ή τη διαδικασία υποστήριξης του αντίστοιχου έργου.
Η OpenAI δεν παρέχει βοήθεια, πρακτική υλοποίηση ή υποστήριξη εντοπισμού σφαλμάτων για ρυθμίσεις, διαμορφώσεις, περιβάλλοντα ή εφαρμογές ανοικτών βαρών που φιλοξενούνται από εσάς ή από τρίτους.
Απόρρητο και ασφάλεια
Απόρρητο και δεδομένα
Αυτά τα μοντέλα έχουν σχεδιαστεί για να εκτελούνται σε υποδομή που ελέγχετε (on-premises ή στο cloud σας ή σε συνεργάτη φιλοξενίας). Η OpenAI δεν λαμβάνει ούτε επεξεργάζεται τα δεδομένα που στέλνετε σε αυτά τα αυτοφιλοξενούμενα μοντέλα, εκτός αν τα κοινοποιήσετε ρητά στην OpenAI ή χρησιμοποιήσετε έναν από τους διαχειριζόμενους συνεργάτες φιλοξενίας μας.
Ασφάλεια
Αυτά τα μοντέλα υποβλήθηκαν σε εκτενή εκπαίδευση και δοκιμές ασφάλειας. Για περισσότερες λεπτομέρειες, δείτε την κάρτα μοντέλου και την τεχνική αναφορά μας.
Αναφορά παραβιάσεων περιεχομένου
Αν πιστεύετε ότι περιεχόμενο που δημιουργήθηκε με μοντέλα gpt‑oss παραβιάζει τις πολιτικές μας, μπορείτε να το αναφέρετε μέσω της φόρμας Αναφοράς περιεχομένου. Παρακαλούμε δώστε όσο το δυνατόν περισσότερες λεπτομέρειες για να βοηθήσετε την ομάδα μας να εξετάσει την υποβολή σας.
Συχνές ερωτήσεις
Είναι αυτά τα μοντέλα δωρεάν;
Τα βάρη των μοντέλων gpt-oss είναι δωρεάν για λήψη και χρήση βάσει της άδειας Apache 2.0 και της πολιτικής χρήσης gpt-oss. Ωστόσο, είστε υπεύθυνοι για κάθε κόστος που σχετίζεται με την εκτέλεσή τους — όπως υπολογιστική ισχύς, αποθήκευση ή χρεώσεις φιλοξενίας από τρίτους. Η τιμολόγηση για αυτά θα εξαρτηθεί από την υποδομή ή τον πάροχο που θα επιλέξετε.
Είναι αυτά τα μοντέλα «ανοικτού κώδικα»;
Χρησιμοποιούμε τον όρο ανοικτά μοντέλα ή ανοικτών βαρών για να δείξουμε ότι τα εκπαιδευμένα βάρη είναι δημόσια διαθέσιμα με την επιτρεπτική άδεια Apache 2.0 και την πολιτική χρήσης gpt-oss. Αυτό σημαίνει ότι μπορείτε να κατεβάσετε τα μοντέλα, να τα εκτελέσετε στη δική σας υποδομή ή με υποστηριζόμενα πλαίσια φιλοξενίας και να τα προσαρμόσετε ή να τα ρυθμίσετε λεπτομερώς.
Τα ανοικτά μοντέλα προσφέρουν στους προγραμματιστές και στους οργανισμούς μεγαλύτερο έλεγχο και ευελιξία. Μπορείτε να επιλέξετε πού θα τα φιλοξενήσετε, να προσαρμόσετε τα μοντέλα για συγκεκριμένες περιπτώσεις χρήσης και να επωφεληθείτε από αδειοδότηση που επιτρέπει ευρεία χρήση, τροποποίηση και αναδιανομή. Παρότι τα εκπαιδευμένα βάρη είναι ανοικτά, ορισμένες γύρω υποδομές ή εργαλεία μπορεί να παραμένουν ιδιόκτητα στους παρόχους τους.
Μπορώ να αποκτήσω πρόσβαση σε αυτά τα μοντέλα μέσω του OpenAI API ή του ChatGPT;
Όχι. Αυτά τα μοντέλα δεν παρέχονται στο OpenAI API και δεν εμφανίζονται στο ChatGPT.
Μπορώ να ρυθμίσω λεπτομερώς τα μοντέλα;
Ναι. Μπορείτε να κάνετε λεπτομερή ρύθμιση χρησιμοποιώντας εργαλεία ανοικτού κώδικα και την υποδομή που προτιμάτε. Δεν προσφέρουμε λεπτομερή ρύθμιση μέσω των API της OpenAI για αυτά τα μοντέλα.
Είναι τα μοντέλα ανοικτών βαρών φθηνότερα από τη χρήση του API;
Το κόστος διαφέρει ανάλογα με την υποδομή, τον φόρτο εργασίας και την επιχειρησιακή προσέγγιση. Η αυτοφιλοξενία μπορεί να είναι φθηνότερη σε ορισμένες περιπτώσεις, ενώ η Πλατφόρμα API μας μπορεί να είναι πιο αποδοτική όταν συνυπολογίζονται η φιλοξενία, η συντήρηση και οι αναβαθμίσεις.
Ποιες δυνατότητες υποστηρίζουν αυτά τα μοντέλα;
Αυτά τα μοντέλα είναι προς το παρόν μοντέλα συλλογιστικής μόνο κειμένου. Τα κοινά runtime υποστηρίζουν streaming, κλήση λειτουργιών και δομημένα αποτελέσματα. Ελέγξτε την τεκμηρίωση του runtime σας για τις ακριβείς δυνατότητες.
Πώς διαφέρει αυτό από το ModAPI;
Πρόκειται για ένα εξαιρετικά ικανό μοντέλο συλλογιστικής που σας επιτρέπει να φέρετε τη δική σας πολιτική. Μπορεί να λειτουργεί παράλληλα με το ModAPI, αλλά πιθανότατα δεν αντικαθιστά περιπτώσεις χρήσης χαμηλής καθυστέρησης.
