OpenAI
Questa pagina è stata tradotta automaticamente. Visualizza l'articolo originale in inglese.

Modelli OpenAI a pesi aperti (gpt-oss)

Scopri i modelli a pesi aperti di OpenAI (gpt-oss) e dove ottenere supporto

Aggiornato: 13 days ago

Nota: questo articolo offre una panoramica di alto livello. Le informazioni per la configurazione tecnica sono disponibili sul sito web di gpt-oss, su GitHub, su Hugging Face e negli OpenAI Cookbook.

Panoramica

Presentiamo due modelli di ragionamento a pesi aperti: gpt‑oss‑120b e gpt‑oss‑20b. Funzionano su un’infrastruttura che controlli tu, oppure tramite provider di hosting.

Nota: questi modelli non sono erogati tramite l’API di OpenAI e non sono disponibili in ChatGPT.

Perché i pesi aperti

  • Scelta e controllo: esegui i modelli on‑premises o nel tuo cloud privato, mantieni la residenza dei dati e adatta le prestazioni alle tue esigenze.

  • Personalizzazione: esegui fine‑tuning o adatta i modelli con i tuoi strumenti open preferiti.

Disponibilità e licenza

  • Licenza: Apache 2.0 consente un uso, una modifica e una redistribuzione ampi, incluso l’uso commerciale (soggetto alla policy di utilizzo di gpt-oss).

  • Erogazione: non disponibili tramite l’API di OpenAI, quindi non si applicano prezzi API e limiti di rate.

  • Compatibilità: possono essere eseguiti con stack di inferenza open source comuni come vLLM, Ollama, llama.cpp e su ambienti GPU in cloud o autogestiti.

Per iniziare

Per ottenere i pesi del modello e le risorse di supporto, puoi:

  • Visitare il sito web di gpt-oss per una panoramica e link diretti.

  • Scaricare i pesi dalla collection su Hugging Face — un hub della community dove puoi trovare entrambi i modelli, vedere esempi d’uso e, facoltativamente, eseguire l’inferenza direttamente tramite i servizi di Hugging Face.

  • Accedere al nostro repo GitHub per il codice di inferenza di riferimento.

  • Usare le guide nell’OpenAI Cookbook per la configurazione con runtime supportati come Ollama, vLLM e Transformers. Il Cookbook include anche istruzioni passo‑passo per l’esecuzione in locale, l’uso di runtime comuni e—dove supportato—il fine‑tuning dei modelli gpt‑oss.

gpt‑oss‑safeguard (anteprima di ricerca)

gpt‑oss‑safeguard è una coppia di modelli di ragionamento per la sicurezza a pesi aperti costruiti sopra gpt‑oss. Sono progettati per la classificazione di sicurezza basata su policy e attività correlate di trust & safety che esegui su un’infrastruttura che controlli tu. Come gli altri modelli gpt‑oss, questi pesi non sono erogati tramite l’API di OpenAI o ChatGPT.

  • Modelli solo testo con schemi di output strutturato di riferimento (ad es. verdetto della policy, motivazione).

  • Porta la tua policy: il modello interpreta la tua policy scritta così può generalizzare tra prodotti con minima ingegnerizzazione.

  • Decisioni motivate: tracce di ragionamento opzionali per supportare debugging e audit (pensate per sviluppatori e professionisti della sicurezza, non per la visualizzazione all’utente finale).

  • Sforzo di ragionamento configurabile: scegli basso / medio / alto per bilanciare latenza e profondità.

  • Licenza: Apache 2.0 (vedi Disponibilità e licenza sotto).

gpt‑oss‑safeguard è adatto per il filtering di input/output per LLM, l’etichettatura di contenuti online e flussi di lavoro di etichettatura in batch offline o di revisione. Per applicazioni generali (chat, agenti, ecc.), consigliamo i modelli core gpt‑oss.

Puoi adattare lo schema alle tue esigenze. Consulta l’OpenAI Cookbook per guide sul prompting ed esempi.

Varianti del modello & dimensionamento

ModelloUso previstoNote
gpt‑oss‑safeguard‑120bProduzione, ragionamento di sicurezza ad alta capacità117B parametri (≈5.1B attivi). Progettato per stare su una

singola GPU da 80 GB
(ad es. NVIDIA H100; funziona anche su GPU con più memoria come AMD MI300X).
gpt‑oss‑safeguard‑20bMinore latenza / ambienti vincolati21B parametri (≈3.6B attivi).

Entrambi i modelli sono sottoposti a fine‑tuning a partire da gpt‑oss senza cambiamenti di architettura. Usano lo stesso template di chat di gpt‑oss; puoi mantenere la tua configurazione esistente. Un pattern di prompting consigliato è inserire la tua policy in un messaggio developer e il contenuto da valutare in un messaggio user.

Supporto e community

I deployment a pesi aperti sono gestiti in autonomia e in self-service. Ecco dove ottenere supporto:

  • Domande, discussioni, suggerimenti: usa le pagine modello su Hugging Face per interagire con la community.

  • Bug riproducibili nel codice di inferenza di riferimento di OpenAI: apri un issue nel repo GitHub di gpt-oss.

  • Problemi con un runtime di terze parti (ad es. vLLM, Ollama, llama.cpp): usa l’issue tracker, i forum o il processo di supporto del relativo progetto.

OpenAI non fornisce assistenza, implementazione pratica o supporto di debugging per configurazioni, ambienti o applicazioni a pesi aperti self‑hosted o ospitate da terze parti.

Continueremo a iterare con la community per migliorare gli strumenti open per la sicurezza, anche tramite la ROOST Model Community (RMC). La RMC riunisce professionisti e ricercatori della sicurezza per condividere best practice sull’integrazione di modelli di IA open source nei flussi di lavoro di sicurezza, inclusi risultati di valutazione e feedback sui modelli. Visita il repo GitHub della RMC per saperne di più su questa partnership e su come partecipare.

Supporto e community

I deployment a pesi aperti sono gestiti in autonomia e in self-service. Ecco dove ottenere supporto:

  • Domande, discussioni, suggerimenti: usa le pagine modello su Hugging Face per interagire con la community.

  • Bug riproducibili nel codice di inferenza di riferimento di OpenAI: apri un issue nel repo GitHub di gpt-oss.

  • Problemi con un runtime di terze parti (ad es. vLLM, Ollama, llama.cpp): usa l’issue tracker, i forum o il processo di supporto del relativo progetto.

OpenAI non fornisce assistenza, implementazione pratica o supporto di debugging per configurazioni, ambienti o applicazioni a pesi aperti self‑hosted o ospitate da terze parti.

Privacy e sicurezza

Privacy e dati

Questi modelli sono progettati per funzionare su un’infrastruttura che controlli tu (on-premises o nel tuo cloud o partner di hosting). OpenAI non riceve né elabora i dati che invii a questi modelli self-hosted, a meno che tu non li condivida esplicitamente con OpenAI o non utilizzi uno dei nostri partner di hosting gestito.

Sicurezza

Questi modelli hanno seguito un’ampia formazione e test sulla sicurezza. Per maggiori dettagli, consulta la nostra model card e il report tecnico.

Segnalare violazioni dei contenuti

Se ritieni che i contenuti generati con i modelli gpt‑oss violino le nostre policy, puoi segnalarli tramite il nostro modulo Report Content. Fornisci quanti più dettagli possibili per aiutare il nostro team a esaminare la tua segnalazione.

FAQ

Questi modelli sono gratuiti?

I pesi dei modelli gpt-oss sono gratuiti da scaricare e utilizzare con licenza Apache 2.0 e la policy di utilizzo di gpt-oss. Tuttavia, sei responsabile di eventuali costi associati alla loro esecuzione — come calcolo, storage o commissioni di hosting di terze parti. Il prezzo dipenderà dall’infrastruttura o dal provider scelto .

Questi modelli sono “open source”?

Usiamo il termine modelli aperti o a pesi aperti per indicare che i pesi addestrati sono pubblicamente disponibili con la licenza permissiva Apache 2.0 e la policy di utilizzo di gpt-oss. Questo significa che puoi scaricare i modelli, eseguirli sulla tua infrastruttura o con framework di hosting supportati e personalizzarli o sottoporli a fine-tuning.

I modelli aperti offrono a sviluppatori e organizzazioni maggiore controllo e flessibilità. Puoi scegliere dove ospitarli, adattarli a casi d’uso specifici e beneficiare di una licenza che consente ampio uso, modifica e redistribuzione. Pur essendo aperti i pesi addestrati, parte dell’infrastruttura o degli strumenti circostanti può restare proprietaria dei rispettivi provider.

Posso accedere a questi modelli tramite l’API di OpenAI o ChatGPT?

No. Questi modelli non sono erogati nell’API di OpenAI e non compaiono in ChatGPT.

Posso fare fine‑tuning dei modelli?

Sì. Puoi fare fine‑tuning usando strumenti open source e l’infrastruttura che preferisci. Non offriamo il fine‑tuning tramite le API di OpenAI per questi modelli.

I modelli a pesi aperti costano meno rispetto all’uso dell’API?

I costi variano in base a infrastruttura, carico di lavoro e approccio operativo. In alcuni casi l’hosting in autonomia può costare meno, mentre la nostra API Platform può risultare più efficiente considerando hosting, manutenzione e upgrade.

Quali funzionalità supportano questi modelli?

Questi modelli sono attualmente modelli di ragionamento solo testo. I runtime più comuni supportano streaming, function calling e output strutturati. Consulta la documentazione del tuo runtime per le capacità esatte.

In cosa è diverso da ModAPI?

Questo è un modello di ragionamento molto potente che ti consente di portare la tua policy. Può funzionare insieme a ModAPI, ma probabilmente non è un sostituto per casi d’uso a bassa latenza.

Questo articolo è stato utile?