Nota: questo articolo offre una panoramica di alto livello. Le informazioni per la configurazione tecnica sono disponibili sul sito web di gpt-oss, su GitHub, su Hugging Face e negli OpenAI Cookbook.
Panoramica
Presentiamo due modelli di ragionamento a pesi aperti: gpt‑oss‑120b e gpt‑oss‑20b. Funzionano su un’infrastruttura che controlli tu, oppure tramite provider di hosting.
Nota: questi modelli non sono erogati tramite l’API di OpenAI e non sono disponibili in ChatGPT.
Perché i pesi aperti
Scelta e controllo: esegui i modelli on‑premises o nel tuo cloud privato, mantieni la residenza dei dati e adatta le prestazioni alle tue esigenze.
Personalizzazione: esegui fine‑tuning o adatta i modelli con i tuoi strumenti open preferiti.
Disponibilità e licenza
Licenza: Apache 2.0 consente un uso, una modifica e una redistribuzione ampi, incluso l’uso commerciale (soggetto alla policy di utilizzo di gpt-oss).
Erogazione: non disponibili tramite l’API di OpenAI, quindi non si applicano prezzi API e limiti di rate.
Compatibilità: possono essere eseguiti con stack di inferenza open source comuni come vLLM, Ollama, llama.cpp e su ambienti GPU in cloud o autogestiti.
Per iniziare
Per ottenere i pesi del modello e le risorse di supporto, puoi:
Visitare il sito web di gpt-oss per una panoramica e link diretti.
Scaricare i pesi dalla collection su Hugging Face — un hub della community dove puoi trovare entrambi i modelli, vedere esempi d’uso e, facoltativamente, eseguire l’inferenza direttamente tramite i servizi di Hugging Face.
Accedere al nostro repo GitHub per il codice di inferenza di riferimento.
Usare le guide nell’OpenAI Cookbook per la configurazione con runtime supportati come Ollama, vLLM e Transformers. Il Cookbook include anche istruzioni passo‑passo per l’esecuzione in locale, l’uso di runtime comuni e—dove supportato—il fine‑tuning dei modelli gpt‑oss.
gpt‑oss‑safeguard (anteprima di ricerca)
gpt‑oss‑safeguard è una coppia di modelli di ragionamento per la sicurezza a pesi aperti costruiti sopra gpt‑oss. Sono progettati per la classificazione di sicurezza basata su policy e attività correlate di trust & safety che esegui su un’infrastruttura che controlli tu. Come gli altri modelli gpt‑oss, questi pesi non sono erogati tramite l’API di OpenAI o ChatGPT.
Modelli solo testo con schemi di output strutturato di riferimento (ad es. verdetto della policy, motivazione).
Porta la tua policy: il modello interpreta la tua policy scritta così può generalizzare tra prodotti con minima ingegnerizzazione.
Decisioni motivate: tracce di ragionamento opzionali per supportare debugging e audit (pensate per sviluppatori e professionisti della sicurezza, non per la visualizzazione all’utente finale).
Sforzo di ragionamento configurabile: scegli basso / medio / alto per bilanciare latenza e profondità.
Licenza: Apache 2.0 (vedi Disponibilità e licenza sotto).
gpt‑oss‑safeguard è adatto per il filtering di input/output per LLM, l’etichettatura di contenuti online e flussi di lavoro di etichettatura in batch offline o di revisione. Per applicazioni generali (chat, agenti, ecc.), consigliamo i modelli core gpt‑oss.
Puoi adattare lo schema alle tue esigenze. Consulta l’OpenAI Cookbook per guide sul prompting ed esempi.
Varianti del modello & dimensionamento
| Modello | Uso previsto | Note |
| gpt‑oss‑safeguard‑120b | Produzione, ragionamento di sicurezza ad alta capacità | 117B parametri (≈5.1B attivi). Progettato per stare su una singola GPU da 80 GB (ad es. NVIDIA H100; funziona anche su GPU con più memoria come AMD MI300X). |
| gpt‑oss‑safeguard‑20b | Minore latenza / ambienti vincolati | 21B parametri (≈3.6B attivi). |
Entrambi i modelli sono sottoposti a fine‑tuning a partire da gpt‑oss senza cambiamenti di architettura. Usano lo stesso template di chat di gpt‑oss; puoi mantenere la tua configurazione esistente. Un pattern di prompting consigliato è inserire la tua policy in un messaggio developer e il contenuto da valutare in un messaggio user.
Supporto e community
I deployment a pesi aperti sono gestiti in autonomia e in self-service. Ecco dove ottenere supporto:
Domande, discussioni, suggerimenti: usa le pagine modello su Hugging Face per interagire con la community.
Bug riproducibili nel codice di inferenza di riferimento di OpenAI: apri un issue nel repo GitHub di gpt-oss.
Problemi con un runtime di terze parti (ad es. vLLM, Ollama, llama.cpp): usa l’issue tracker, i forum o il processo di supporto del relativo progetto.
OpenAI non fornisce assistenza, implementazione pratica o supporto di debugging per configurazioni, ambienti o applicazioni a pesi aperti self‑hosted o ospitate da terze parti.
Continueremo a iterare con la community per migliorare gli strumenti open per la sicurezza, anche tramite la ROOST Model Community (RMC). La RMC riunisce professionisti e ricercatori della sicurezza per condividere best practice sull’integrazione di modelli di IA open source nei flussi di lavoro di sicurezza, inclusi risultati di valutazione e feedback sui modelli. Visita il repo GitHub della RMC per saperne di più su questa partnership e su come partecipare.
Supporto e community
I deployment a pesi aperti sono gestiti in autonomia e in self-service. Ecco dove ottenere supporto:
Domande, discussioni, suggerimenti: usa le pagine modello su Hugging Face per interagire con la community.
Bug riproducibili nel codice di inferenza di riferimento di OpenAI: apri un issue nel repo GitHub di gpt-oss.
Problemi con un runtime di terze parti (ad es. vLLM, Ollama, llama.cpp): usa l’issue tracker, i forum o il processo di supporto del relativo progetto.
OpenAI non fornisce assistenza, implementazione pratica o supporto di debugging per configurazioni, ambienti o applicazioni a pesi aperti self‑hosted o ospitate da terze parti.
Privacy e sicurezza
Privacy e dati
Questi modelli sono progettati per funzionare su un’infrastruttura che controlli tu (on-premises o nel tuo cloud o partner di hosting). OpenAI non riceve né elabora i dati che invii a questi modelli self-hosted, a meno che tu non li condivida esplicitamente con OpenAI o non utilizzi uno dei nostri partner di hosting gestito.
Sicurezza
Questi modelli hanno seguito un’ampia formazione e test sulla sicurezza. Per maggiori dettagli, consulta la nostra model card e il report tecnico.
Segnalare violazioni dei contenuti
Se ritieni che i contenuti generati con i modelli gpt‑oss violino le nostre policy, puoi segnalarli tramite il nostro modulo Report Content. Fornisci quanti più dettagli possibili per aiutare il nostro team a esaminare la tua segnalazione.
FAQ
Questi modelli sono gratuiti?
I pesi dei modelli gpt-oss sono gratuiti da scaricare e utilizzare con licenza Apache 2.0 e la policy di utilizzo di gpt-oss. Tuttavia, sei responsabile di eventuali costi associati alla loro esecuzione — come calcolo, storage o commissioni di hosting di terze parti. Il prezzo dipenderà dall’infrastruttura o dal provider scelto .
Questi modelli sono “open source”?
Usiamo il termine modelli aperti o a pesi aperti per indicare che i pesi addestrati sono pubblicamente disponibili con la licenza permissiva Apache 2.0 e la policy di utilizzo di gpt-oss. Questo significa che puoi scaricare i modelli, eseguirli sulla tua infrastruttura o con framework di hosting supportati e personalizzarli o sottoporli a fine-tuning.
I modelli aperti offrono a sviluppatori e organizzazioni maggiore controllo e flessibilità. Puoi scegliere dove ospitarli, adattarli a casi d’uso specifici e beneficiare di una licenza che consente ampio uso, modifica e redistribuzione. Pur essendo aperti i pesi addestrati, parte dell’infrastruttura o degli strumenti circostanti può restare proprietaria dei rispettivi provider.
Posso accedere a questi modelli tramite l’API di OpenAI o ChatGPT?
No. Questi modelli non sono erogati nell’API di OpenAI e non compaiono in ChatGPT.
Posso fare fine‑tuning dei modelli?
Sì. Puoi fare fine‑tuning usando strumenti open source e l’infrastruttura che preferisci. Non offriamo il fine‑tuning tramite le API di OpenAI per questi modelli.
I modelli a pesi aperti costano meno rispetto all’uso dell’API?
I costi variano in base a infrastruttura, carico di lavoro e approccio operativo. In alcuni casi l’hosting in autonomia può costare meno, mentre la nostra API Platform può risultare più efficiente considerando hosting, manutenzione e upgrade.
Quali funzionalità supportano questi modelli?
Questi modelli sono attualmente modelli di ragionamento solo testo. I runtime più comuni supportano streaming, function calling e output strutturati. Consulta la documentazione del tuo runtime per le capacità esatte.
In cosa è diverso da ModAPI?
Questo è un modello di ragionamento molto potente che ti consente di portare la tua policy. Può funzionare insieme a ModAPI, ma probabilmente non è un sostituto per casi d’uso a bassa latenza.
