Nota: questo articolo offre una panoramica generale. Le informazioni per la configurazione tecnica sono disponibili sul sito web gpt-oss, su GitHub, su Hugging Face e negli OpenAI Cookbooks.

Panoramica

Presentiamo due modelli di ragionamento a pesi aperti: gpt‑oss‑120b e gpt‑oss‑20b. Funzionano sull’infrastruttura che controlli o tramite provider di hosting.

Nota: questi modelli non sono serviti tramite l’API OpenAI e non sono disponibili in ChatGPT.

Perché i pesi aperti

Scelta e controllo: esegui i modelli on-premises o nel tuo cloud privato, mantieni la residenza dei dati e adatta le prestazioni alle tue esigenze.
Personalizzazione: esegui il fine-tuning o adatta i modelli con gli strumenti aperti che preferisci.

Disponibilità e licenze

Licenza: Apache 2.0 consente un ampio uso, modifica e ridistribuzione, incluso l’uso commerciale (soggetto alla nostra policy di utilizzo di gpt-oss).
Serving: non disponibile tramite l’API OpenAI, quindi i prezzi dell’API e i limiti di richieste non si applicano.
Compatibilità: può essere eseguito con stack di inferenza aperti comuni come vLLM, Ollama, llama.cpp e in ambienti GPU cloud o autogestiti.

Primi passi

Per ottenere i pesi del modello e le risorse di supporto, puoi:

Visitare il sito web gpt-oss per una panoramica e link diretti.
Scaricare i pesi dalla raccolta Hugging Face — un hub della community in cui puoi trovare entrambi i modelli, vedere esempi d’uso e, facoltativamente, eseguire l’inferenza direttamente tramite i servizi di Hugging Face.
Accedere al nostro repository GitHub per il codice di inferenza di riferimento.
Usare le guide nell’OpenAI Cookbook per la configurazione con runtime supportati come Ollama, vLLM e Transformers. Il Cookbook include anche istruzioni dettagliate per l’esecuzione locale, l’uso di runtime comuni e, dove supportato, il fine-tuning dei modelli gpt‑oss.

gpt‑oss‑safeguard (anteprima di ricerca)

gpt‑oss‑safeguard è una coppia di modelli di ragionamento per la sicurezza a pesi aperti basati su gpt‑oss. Sono progettati per la classificazione della sicurezza basata su policy e attività correlate di trust & safety eseguite sull’infrastruttura che controlli. Come altri modelli gpt‑oss, questi pesi non sono serviti tramite l’API OpenAI o ChatGPT.

Modelli solo testuali con schemi di riferimento per risultati strutturati (ad es. verdetto della policy, motivazione).
Porta la tua policy: il modello interpreta la tua policy scritta per generalizzare tra prodotti con un intervento tecnico minimo.
Decisioni ragionate: tracce di ragionamento opzionali per facilitare debug e audit (destinate a sviluppatori e professionisti della sicurezza, non alla visualizzazione per gli utenti finali).
Sforzo di ragionamento configurabile: scegli basso / medio / alto per bilanciare latenza e profondità.
Licenza: Apache 2.0 (vedi Disponibilità e licenze di seguito).

gpt‑oss‑safeguard è adatto al filtraggio input/output per LLM, all’etichettatura di contenuti online e ai flussi di lavoro di etichettatura o revisione batch offline. Per applicazioni generali (chat, agenti, ecc.), consigliamo i modelli gpt‑oss principali.

Puoi adattare lo schema alle tue esigenze. Consulta l’OpenAI Cookbook per guide sui prompt ed esempi.

Varianti e dimensionamento dei modelli

Modello	Uso previsto	Note
gpt‑oss‑safeguard‑120b	Produzione, ragionamento sulla sicurezza ad alta capacità	117 miliardi di parametri (≈5,1 miliardi attivi). Progettato per funzionare su una singola GPU da 80 GB (ad es. NVIDIA H100; funziona anche su GPU con memoria maggiore, come AMD MI300X).
gpt‑oss‑safeguard‑20b	Ambienti a bassa latenza / con vincoli	21 miliardi di parametri (≈3,6 miliardi attivi).

Entrambi i modelli sono ottimizzati tramite fine-tuning a partire da gpt-oss, senza modifiche all’architettura. Usano lo stesso template di chat di gpt-oss; puoi mantenere la configurazione esistente. Uno schema di prompting consigliato consiste nell’inserire la tua policy in un messaggio dello sviluppatore e il contenuto da valutare in un messaggio utente.

Supporto e community

Le distribuzioni a pesi aperti sono autogestite e con supporto autonomo. Ecco dove ottenere supporto:

Domande, discussioni, suggerimenti: usa le pagine dei modelli su Hugging Face per interagire con la community.
Bug riproducibili nel codice di inferenza di riferimento di OpenAI: apri una issue nel repository GitHub di gpt-oss.
Problemi con un runtime di terze parti (ad es. vLLM, Ollama, llama.cpp): usa il tracker delle issue, i forum o la procedura di supporto del rispettivo progetto.

OpenAI non fornisce assistenza, implementazione pratica o supporto di debug per configurazioni, ambienti o applicazioni a pesi aperti self-hosted o ospitati da terze parti.

Continueremo a collaborare con la community per migliorare gli strumenti aperti per la sicurezza, anche tramite la ROOST Model Community (RMC). La RMC riunisce professionisti e ricercatori della sicurezza per condividere best practice per integrare modelli di IA open source nei flussi di lavoro di sicurezza, inclusi risultati di valutazione e feedback sui modelli. Visita il repository GitHub della RMC per saperne di più su questa partnership e su come partecipare.

Supporto e community

Le distribuzioni a pesi aperti sono autogestite e con supporto autonomo. Ecco dove ottenere supporto:

Domande, discussioni, suggerimenti: usa le pagine dei modelli su Hugging Face per interagire con la community.
Bug riproducibili nel codice di inferenza di riferimento di OpenAI: apri una issue nel repository GitHub di gpt-oss.
Problemi con un runtime di terze parti (ad es. vLLM, Ollama, llama.cpp): usa il tracker delle issue, i forum o la procedura di supporto del rispettivo progetto.

OpenAI non fornisce assistenza, implementazione pratica o supporto di debug per configurazioni, ambienti o applicazioni a pesi aperti self-hosted o ospitati da terze parti.

Privacy e sicurezza

Privacy e dati

Questi modelli sono progettati per essere eseguiti sull’infrastruttura che controlli (on-premises o nel tuo cloud o partner di hosting). OpenAI non riceve né elabora i dati che invii a questi modelli self-hosted, a meno che tu non li condivida esplicitamente con OpenAI o usi uno dei nostri partner di hosting gestito.

Sicurezza

Questi modelli sono stati sottoposti a un ampio addestramento e a test approfonditi sulla sicurezza. Per maggiori dettagli, consulta la nostra scheda modello e il rapporto tecnico.

Segnalazione di violazioni dei contenuti

Se ritieni che contenuti generati con i modelli gpt‑oss violino le nostre policy, puoi segnalarli tramite il nostro modulo di segnalazione dei contenuti. Fornisci il maggior numero possibile di dettagli per aiutare il nostro team a esaminare la tua segnalazione.

FAQ

Questi modelli sono gratuiti?

I pesi dei modelli gpt-oss possono essere scaricati e utilizzati gratuitamente in base alla licenza Apache 2.0 e alla policy di utilizzo di gpt-oss. Tuttavia, sei responsabile di eventuali costi associati alla loro esecuzione, come calcolo, storage o tariffe di hosting di terze parti. I relativi prezzi dipenderanno dall’infrastruttura o dal provider scelto.

Questi modelli sono “open source”?

Usiamo il termine modelli aperti o a pesi aperti per indicare che i pesi addestrati sono disponibili pubblicamente con la licenza permissiva Apache 2.0 e la policy di utilizzo di gpt-oss. Ciò significa che puoi scaricare i modelli, eseguirli sulla tua infrastruttura o con framework di hosting supportati, e personalizzarli o sottoporli a fine-tuning.

I modelli aperti offrono a sviluppatori e organizzazioni maggiore controllo e flessibilità. Puoi scegliere dove ospitarli, adattare i modelli a casi d’uso specifici e beneficiare di una licenza che consente un ampio uso, modifica e ridistribuzione. Sebbene i pesi addestrati siano aperti, alcune infrastrutture o strumenti circostanti possono restare proprietari dei rispettivi provider.

Posso accedere a questi modelli tramite l’API OpenAI o ChatGPT?

No. Questi modelli non sono serviti nell’API OpenAI e non compaiono in ChatGPT.

Posso eseguire il fine-tuning dei modelli?

Sì. Puoi eseguire il fine-tuning usando strumenti open source e l’infrastruttura che preferisci. Non offriamo il fine-tuning tramite le API OpenAI per questi modelli.

I modelli a pesi aperti sono più economici rispetto all’uso dell’API?

I costi variano in base all’infrastruttura, al carico di lavoro e all’approccio operativo. Il self-hosting può essere più economico in alcuni casi, mentre la nostra piattaforma API può risultare più efficiente considerando hosting, manutenzione e aggiornamenti.

Quali funzionalità supportano questi modelli?

Attualmente questi modelli sono modelli di ragionamento solo testuali. I runtime comuni supportano streaming, chiamata di funzioni e risultati strutturati. Consulta la documentazione del tuo runtime per le capacità esatte.

In che modo è diverso da ModAPI?

È un modello di ragionamento altamente capace che ti consente di portare la tua policy. Può funzionare insieme a ModAPI, ma probabilmente non ne sostituisce l’uso nei casi a bassa latenza.

Modelli a pesi aperti di OpenAI (gpt-oss)

Panoramica

Perché i pesi aperti

Disponibilità e licenze

Primi passi

gpt‑oss‑safeguard (anteprima di ricerca)

Varianti e dimensionamento dei modelli

Supporto e community

Supporto e community

Privacy e sicurezza

Privacy e dati

Sicurezza

Segnalazione di violazioni dei contenuti

FAQ

Questi modelli sono gratuiti?

Questi modelli sono “open source”?

Posso accedere a questi modelli tramite l’API OpenAI o ChatGPT?

Posso eseguire il fine-tuning dei modelli?

I modelli a pesi aperti sono più economici rispetto all’uso dell’API?

Quali funzionalità supportano questi modelli?

In che modo è diverso da ModAPI?

Questo articolo è stato utile?