Remarque : Cet article offre un aperçu général. Les renseignements sur la configuration technique se trouvent sur le site Web gpt-oss, GitHub, Hugging Face et OpenAI Cookbooks.
Aperçu
Présentation de deux modèles de raisonnement à poids ouverts : gpt‑oss‑120b et gpt‑oss‑20b. Ils s’exécutent sur l’infrastructure que vous contrôlez, ou par l’entremise de fournisseurs d’hébergement.
Remarquea0: Ces modèles ne sont pas offerts par l’API d’OpenAI et ne sont pas disponibles dans ChatGPT.
Pourquoi des poids ouverts
Choix et contrôle : Exécutez les modèles sur site ou dans votre nuage privé, maintenez la résidence des données et adaptez la performance à vos besoins.
Personnalisation : Ajustez finement ou adaptez les modèles avec les outils ouverts de votre choix.
Disponibilité et licences
Licence : Apache 2.0 permet une vaste utilisation, modification et redistribution, y compris l’utilisation commerciale (sous réserve de notre politique d’utilisation de gpt-oss).
Service : Non disponible par l’entremise de l’API OpenAI; la tarification et les limites de débit de l’API ne s’appliquent donc pas.
Compatibilité : Peut être exécuté avec des piles d’inférence ouvertes courantes comme vLLM, Ollama et llama.cpp, ainsi que dans des environnements GPU infonuagiques ou autogérés.
Premiers pas
Pour obtenir les poids du modèle et les ressources de soutien, vous pouvez :
Visiter le site Web gpt-oss pour obtenir un aperçu et des liens directs.
Télécharger les poids à partir de la collection Hugging Face — un carrefour communautaire où vous pouvez trouver les deux modèles, voir des exemples d’utilisation et, au besoin, exécuter l’inférence directement au moyen des services de Hugging Face.
Accéder à notre dépôt GitHub pour le code d’inférence de référence.
Utiliser les guides de l’OpenAI Cookbook pour la configuration avec des environnements d’exécution pris en charge comme Ollama, vLLM et Transformers. Le Cookbook comprend aussi des instructions étape par étape pour l’exécution locale, l’utilisation d’environnements d’exécution courants et, lorsque c’est pris en charge, l’ajustement fin des modèles gpt‑oss.
gpt‑oss‑safeguard (aperçu de recherche)
gpt‑oss‑safeguard est une paire de modèles de raisonnement de sécurité à poids ouverts bâtis sur gpt‑oss. Ils sont conçus pour la classification de sécurité fondée sur des politiques et les tâches connexes de confiance et sécurité que vous exécutez sur l’infrastructure que vous contrôlez. Comme les autres modèles gpt‑oss, ces poids ne sont pas servis par l’API OpenAI ni par ChatGPT.
Modèles texte seulement avec schémas de sorties structurées de référence (p. ex., verdict de politique, justification).
Apportez votre propre politique : le modèle interprète votre politique écrite afin de pouvoir généraliser à plusieurs produits avec un minimum d’ingénierie.
Décisions raisonnées : traces de raisonnement facultatives pour faciliter le débogage et les audits (destinées aux développeurs et aux praticiens de la sécurité, et non à l’affichage aux utilisateurs finaux).
Effort de raisonnement configurable : choisissez faible / moyen / élevé pour faire un compromis entre latence et profondeur.
Licence : Apache 2.0 (voir Disponibilité et licences ci-dessous).
gpt‑oss‑safeguard convient bien au filtrage des entrées/sorties pour les LLM, à l’étiquetage de contenu en ligne et aux flux de travail d’étiquetage ou de révision par lots hors ligne. Pour les applications générales (clavardage, agents, etc.), nous recommandons les modèles gpt‑oss de base.
Vous pouvez adapter le schéma à vos besoins. Veuillez consulter l’OpenAI Cookbook pour des guides sur les invites et des exemples.
Variantes de modèles et dimensionnement
| Modèle | Utilisation prévue | Notes |
|---|---|---|
| gpt‑oss‑safeguard‑120b | Production, raisonnement de sécurité à haute capacité | 117 G de paramètres (≈5,1 G actifs). Conçu pour tenir sur un seul GPU de 80 Go (p. ex., NVIDIA H100; fonctionne aussi sur des GPU à plus grande mémoire comme AMD MI300X). |
| gpt‑oss‑safeguard‑20b | Latence plus faible / environnements contraints | 21 G de paramètres (≈3,6 G actifs). |
Les deux modèles sont affinés à partir de gpt‑oss, sans changement d’architecture. Ils utilisent le même gabarit de conversation que gpt‑oss; vous pouvez conserver votre configuration existante. Un schéma d’invite recommandé consiste à placer votre politique dans un message développeur et le contenu à évaluer dans un message utilisateur.
Soutien et communauté
Les déploiements à poids ouverts sont autogérés et pris en charge par vous-même. Voici où obtenir du soutien :
Questions, discussions, conseils : Utilisez les pages de modèles Hugging Face pour échanger avec la communauté.
Bogues reproductibles dans le code d’inférence de référence d’OpenAI : Ouvrez un ticket dans le dépôt GitHub gpt-oss.
Problèmes avec un environnement d’exécution tiers (p. ex., vLLM, Ollama, llama.cpp) : Utilisez le suivi des problèmes, les forums ou le processus de soutien du projet concerné.
OpenAI ne fournit pas d’assistance, d’implémentation pratique ni de soutien au débogage pour les configurations, environnements ou applications à poids ouverts autohébergés ou hébergés par des tiers.
Nous continuerons d’itérer avec la communauté afin d’améliorer les outils de sécurité ouverts, notamment par l’entremise de la ROOST Model Community (RMC). La RMC réunit des praticiens et des chercheurs en sécurité pour partager les pratiques exemplaires d’intégration de modèles d’IA à source ouvert dans les flux de travail de sécurité, y compris les résultats d’évaluation et les commentaires sur les modèles. Visitez le dépôt GitHub de la RMC pour en savoir plus sur ce partenariat et sur la façon d’y participer.
Soutien et communauté
Les déploiements à poids ouverts sont autogérés et pris en charge par vous-même. Voici où obtenir du soutien :
Questions, discussions, conseils : Utilisez les pages de modèles Hugging Face pour échanger avec la communauté.
Bogues reproductibles dans le code d’inférence de référence d’OpenAI : Ouvrez un ticket dans le dépôt GitHub gpt-oss.
Problèmes avec un environnement d’exécution tiers (p. ex., vLLM, Ollama, llama.cpp) : Utilisez le suivi des problèmes, les forums ou le processus de soutien du projet concerné.
OpenAI ne fournit pas d’assistance, d’implémentation pratique ni de soutien au débogage pour les configurations, environnements ou applications à poids ouverts autohébergés ou hébergés par des tiers.
Confidentialité et sécurité
Confidentialité et données
Ces modèles sont conçus pour s’exécuter sur l’infrastructure que vous contrôlez (sur site, dans votre nuage ou chez votre partenaire d’hébergement). OpenAI ne reçoit ni ne traite les données que vous envoyez à ces modèles autohébergés, sauf si vous les partagez explicitement avec OpenAI ou utilisez l’un de nos partenaires d’hébergement géré.
Sécurité
Ces modèles ont fait l’objet d’un entraînement et de tests de sécurité approfondis. Pour en savoir plus, consultez notre fiche modèle et notre rapport technique.
Signalement des violations de contenu
Si vous croyez que du contenu généré avec des modèles gpt‑oss enfreint nos politiques, vous pouvez le signaler au moyen de notre formulaire de signalement de contenu. Veuillez fournir le plus de détails possible afin d’aider notre équipe à examiner votre soumission.
FAQ
Ces modèles sont-ils gratuits?
Les poids des modèles gpt-oss peuvent être téléchargés et utilisés gratuitement sous la licence Apache 2.0 et conformément à la politique d’utilisation de gpt-oss. Cependant, vous êtes responsable de tous les coûts associés à leur exécution — comme les frais de calcul, de stockage ou d’hébergement tiers. Les prix dépendront de l’infrastructure ou du fournisseur que vous choisirez.
Ces modèles sont-ils « source ouvert »?
Nous utilisons le terme modèles ouverts ou à poids ouverts pour indiquer que les poids entraînés sont accessibles au public sous la licence permissive Apache 2.0 et la politique d’utilisation de gpt-oss. Cela signifie que vous pouvez télécharger les modèles, les exécuter sur votre propre infrastructure ou avec des cadres d’hébergement pris en charge, et les personnaliser ou les ajuster finement.
Les modèles ouverts donnent aux développeurs et aux organisations plus de contrôle et de flexibilité. Vous pouvez choisir où les héberger, les adapter à des cas d’utilisation précis et profiter d’une licence qui permet une vaste utilisation, modification et redistribution. Bien que les poids entraînés soient ouverts, une partie de l’infrastructure ou des outils connexes peut demeurer propriétaire à leurs fournisseurs.
Puis-je accéder à ces modèles par l’API OpenAI ou ChatGPT?
Non. Ces modèles ne sont pas servis dans l’API OpenAI et n’apparaissent pas dans ChatGPT.
Puis-je ajuster finement les modèles?
Oui. Vous pouvez effectuer l’ajustement fin avec des outils à source ouvert et l’infrastructure de votre choix. Nous n’offrons pas l’ajustement fin de ces modèles par l’entremise des API OpenAI.
Les modèles à poids ouverts sont-ils moins chers que l’utilisation de l’API?
Les coûts varient selon l’infrastructure, la charge de travail et l’approche opérationnelle. L’autohébergement peut être moins coûteux dans certains cas, tandis que notre plateforme d’API peut être plus efficace en tenant compte de l’hébergement, de la maintenance et des mises à niveau.
Quelles fonctionnalités ces modèles prennent-ils en charge?
Ces modèles sont actuellement des modèles de raisonnement texte seulement. Les environnements d’exécution courants prennent en charge la diffusion en continu, l’appel de fonction et les sorties structurées. Consultez la documentation de votre environnement d’exécution pour connaître les capacités exactes.
En quoi cela diffère-t-il de ModAPI?
Il s’agit d’un modèle de raisonnement très performant qui vous permet d’apporter votre propre politique. Il peut fonctionner en tandem avec ModAPI, mais ne remplacera probablement pas les cas d’utilisation à faible latence.
