Notă: Acest articol oferă o prezentare generală. Informații pentru configurarea tehnică pot fi găsite pe site-ul gpt-oss, pe GitHub, pe Hugging Face și în OpenAI Cookbooks.
Prezentare generală
Vă prezentăm două modele de raţionament open-weight: gpt‑oss‑120b și gpt‑oss‑20b. Acestea rulează pe infrastructura pe care o controlați sau prin furnizori de găzduire.
Notă: Aceste modele nu sunt furnizate prin OpenAI API și nu sunt disponibile în ChatGPT.
De ce open-weights
Alegere și control: Rulați modelele on-premises sau în cloudul dvs. privat, păstrați rezidența datelor și adaptați performanța la nevoile dvs.
Personalizare: Ajustați fin sau adaptați modelele cu instrumentele deschise preferate.
Disponibilitate și licențiere
Licență: Apache 2.0 permite utilizarea, modificarea și redistribuirea pe scară largă, inclusiv utilizarea comercială (sub rezerva politicii de utilizare gpt-oss).
Furnizare: Nu sunt disponibile prin OpenAI API, deci prețurile și limitele de rată ale API-ului nu se aplică.
Compatibilitate: Pot rula cu stackuri comune deschise de inferență, precum vLLM, Ollama, llama.cpp, și în medii GPU în cloud sau autogestionate.
Primii pași
Pentru a obține ponderile modelului și resursele de suport, puteți:
Vizita site-ul gpt-oss pentru o prezentare generală și linkuri directe.
Descărca ponderile din colecția Hugging Face — un hub al comunității unde puteți găsi ambele modele, vedea exemple de utilizare și, opțional, rula inferența direct prin serviciile Hugging Face.
Accesa repo-ul nostru GitHub pentru codul de referință pentru inferență.
Folosi ghidurile din OpenAI Cookbook pentru configurarea cu runtime-uri compatibile precum Ollama, vLLM și Transformers. Cookbook include și instrucțiuni pas cu pas pentru rulare locală, folosirea runtime-urilor comune și — unde este compatibil — ajustarea fină a modelelor gpt‑oss.
gpt‑oss‑safeguard (previzualizare de cercetare)
gpt‑oss‑safeguard este o pereche de modele open-weight de raţionament pentru siguranță construite pe baza gpt‑oss. Sunt concepute pentru clasificarea siguranței bazată pe politici și sarcini conexe de trust & safety pe care le rulați pe infrastructura pe care o controlați. La fel ca alte modele gpt‑oss, aceste ponderi nu sunt furnizate prin OpenAI API sau ChatGPT.
Modele doar text cu scheme de referință pentru structured outputs (de ex., verdict de politică, justificare).
Bring-your-own policy: modelul interpretează politica dvs. scrisă astfel încât să poată generaliza între produse cu inginerie minimă.
Decizii motivate: urme opționale de raţionament pentru a ajuta la depanare și audituri (destinate dezvoltatorilor și practicienilor în siguranță, nu pentru afișare utilizatorilor finali).
Efort de raţionament configurabil: alegeți low / medium / high pentru a echilibra latența vs. profunzimea.
Licență: Apache 2.0 (vedeți Disponibilitate și licențiere mai jos).
gpt‑oss‑safeguard este potrivit pentru filtrarea inputului/outputului pentru LLM-uri, etichetarea conținutului online și fluxuri de etichetare sau revizuire batch offline. Pentru aplicații generale (chat, agenți etc.), recomandăm modelele gpt‑oss de bază.
Puteți adapta schema la nevoile dvs. Consultați OpenAI Cookbook pentru ghiduri despre prompting și exemple.
Variante de model și dimensionare
| Model | Utilizare prevăzută | Note |
| gpt‑oss‑safeguard‑120b | Producție, raţionament de siguranță de mare capacitate | 117B parametri (≈5.1B activi). Conceput să încapă pe un singur GPU de 80 GB (de ex., NVIDIA H100; rulează și pe GPU-uri cu memorie mai mare, precum AMD MI300X). |
| gpt‑oss‑safeguard‑20b | Medii cu latență mai redusă / constrânse | 21B parametri (≈3.6B activi). |
Ambele modele sunt ajustate fin din gpt‑oss fără modificări de arhitectură. Folosesc același șablon de chat ca gpt‑oss; vă puteți păstra configurarea existentă. Un model de prompting recomandat este să plasați politica dvs. într-un mesaj de developer și conținutul de evaluat într-un mesaj de user.
Asistență și comunitate
Implementările open-weight sunt autogestionate și autoservite. Iată unde puteți obține asistență:
Întrebări, discuții, sfaturi: Folosiți paginile de model Hugging Face pentru a interacționa cu comunitatea.
Buguri reproductibile în codul de referință OpenAI pentru inferență: Deschideți un issue în repo-ul gpt-oss de pe GitHub.
Probleme cu un runtime terț (de ex., vLLM, Ollama, llama.cpp): Folosiți trackerul de issue-uri, forumurile sau procesul de asistență al proiectului respectiv.
OpenAI nu oferă asistență, implementare practică sau suport de depanare pentru nicio configurație, mediu sau aplicație open-weight auto-găzduită sau găzduită de terți.
Vom continua să iterăm împreună cu comunitatea pentru a îmbunătăți instrumentele deschise de siguranță, inclusiv prin ROOST Model Community (RMC). RMC reunește practicieni și cercetători în siguranță pentru a împărtăși bune practici privind implementarea modelelor AI open source în fluxuri de lucru de siguranță, inclusiv rezultate ale evaluărilor și feedback despre modele. Vizitați repo-ul GitHub al RMC pentru a afla mai multe despre acest parteneriat și cum vă puteți implica.
Asistență și comunitate
Implementările open-weight sunt autogestionate și autoservite. Iată unde puteți obține asistență:
Întrebări, discuții, sfaturi: Folosiți paginile de model Hugging Face pentru a interacționa cu comunitatea.
Buguri reproductibile în codul de referință OpenAI pentru inferență: Deschideți un issue în repo-ul gpt-oss de pe GitHub.
Probleme cu un runtime terț (de ex., vLLM, Ollama, llama.cpp): Folosiți trackerul de issue-uri, forumurile sau procesul de asistență al proiectului respectiv.
OpenAI nu oferă asistență, implementare practică sau suport de depanare pentru nicio configurație, mediu sau aplicație open-weight auto-găzduită sau găzduită de terți.
Confidențialitate și siguranță
Confidențialitate și date
Aceste modele sunt concepute să ruleze pe infrastructura pe care o controlați (on-premises sau în cloudul dvs. ori la partenerul dvs. de găzduire). OpenAI nu primește și nu prelucrează datele pe care le trimiteți acestor modele auto-găzduite decât dacă le partajați în mod explicit cu OpenAI sau utilizați unul dintre partenerii noștri de găzduire gestionați.
Siguranță
Aceste modele au trecut prin instruire și testare extinsă în materie de siguranță. Pentru mai multe detalii, consultați fișa de model și raportul tehnic.
Raportarea încălcărilor de conținut
Dacă considerați că un conținut generat cu modelele gpt‑oss încalcă politicile noastre, îl puteți raporta prin formularul Raportare conținut. Vă rugăm să oferiți cât mai multe detalii posibil pentru a ajuta echipa noastră să vă analizeze trimiterea.
Întrebări frecvente
Sunt aceste modele gratuite?
Ponderile modelului gpt-oss sunt gratuite pentru descărcare și utilizare în baza licenței Apache 2.0 și a politicii de utilizare gpt-oss. Totuși, sunteți responsabil pentru orice costuri asociate cu rularea lor — cum ar fi costurile de calcul, stocare sau găzduire terță. Prețurile acestora vor depinde de infrastructura sau furnizorul ales de dvs.
Sunt aceste modele „open source”?
Folosim termenul open models sau open-weight pentru a indica faptul că ponderile antrenate sunt disponibile public în baza licenței permisive Apache 2.0 și a politicii de utilizare gpt-oss. Asta înseamnă că puteți descărca modelele, le puteți rula pe propria infrastructură sau cu frameworkuri de găzduire compatibile și le puteți personaliza sau ajusta fin.
Open model le oferă dezvoltatorilor și organizațiilor control și flexibilitate sporite. Puteți alege unde să găzduiți, adapta modelele pentru cazuri de utilizare specifice și beneficia de o licențiere care permite utilizarea, modificarea și redistribuirea pe scară largă. Deși ponderile antrenate sunt deschise, o parte din infrastructura sau instrumentele conexe pot rămâne proprietare furnizorilor lor.
Pot accesa aceste modele prin OpenAI API sau ChatGPT?
Nu. Aceste modele nu sunt furnizate în OpenAI API și nu apar în ChatGPT.
Pot ajusta fin modelele?
Da. Puteți face ajustare fină folosind instrumente open source și infrastructura preferată. Nu oferim ajustare fină prin API-urile OpenAI pentru aceste modele.
Sunt modelele open-weight mai ieftine decât utilizarea API-ului?
Costurile variază în funcție de infrastructură, volum de lucru și abordare operațională. Auto-găzduirea poate fi mai ieftină în unele cazuri, în timp ce platforma noastră API poate fi mai eficientă dacă luați în calcul găzduirea, mentenanța și upgrade-urile.
Ce funcționalități acceptă aceste modele?
Aceste modele sunt în prezent modele de raţionament doar text. Runtime-urile comune acceptă streaming, apelarea funcțiilor și speech-to-speech. Consultați documentația runtime-ului dvs. pentru capabilitățile exacte.
Cum diferă acest lucru de ModAPI?
Acesta este un model de raţionament foarte capabil care vă permite să veniți cu propria politică. Poate funcționa în tandem cu ModAPI, dar probabil nu îl înlocuiește pentru cazurile de utilizare cu latență redusă.
