Nous croyons au développement et au déploiement responsables et itératifs comme moyen d’atteindre une intelligence artificielle générale sûre. Nous menons un travail important de tests de sécurité et d’alignement, ainsi que des actions d’atténuation, avant de lancer un modèle au public, et nous disposons également de systèmes automatisés et humains pour aider à détecter les contenus problématiques qui apparaissent sur nos services destinés aux particuliers, tels que ChatGPT et les GPT. Nous présentons ci-dessous certaines de ces mesures.
ChatGPT, ImageGen et SORA
Nous utilisons des outils automatisés, comme une version interne de notre API /moderations, pour détecter des contenus (prompts, réponses, fichiers importés) susceptibles d’être nuisibles ou d’enfreindre nos politiques d’utilisation. Si nous détectons du contenu problématique, nous vous avertirons généralement que votre contenu peut enfreindre nos politiques d’utilisation, ou nous empêcherons le modèle de répondre à votre prompt. Nous pouvons également empêcher le partage de la conversation contenant le prompt ou la réponse problématique. Dans un nombre très limité de cas, nous pouvons aussi suspendre votre compte en cas de comportement particulièrement grave.
Nous acceptons également les signalements humains de contenus problématiques sur ChatGPT et SORA. Nous utilisons une combinaison de systèmes automatisés et une équipe d’experts formés pour examiner ces signalements.
ChatGPT : Si quelqu’un partage une conversation que vous estimez contenir du contenu problématique, vous pouvez aussi nous le signaler.
SORA : Si vous voyez une vidéo ou une image dans votre fil que vous estimez contenir du contenu problématique, vous pouvez nous la signaler.
Pour plus de détails sur la manière de signaler du contenu directement dans ChatGPT ou SORA, consultez cet article.
GPT
Nous utilisons également des outils automatisés comme notre API /moderation pour voir si un GPT est potentiellement problématique. Si nous détectons du contenu problématique associé au GPT, nous prendrons des mesures, comme empêcher sa diffusion. Le créateur peut modifier la configuration du GPT ou de l’API afin de supprimer le contenu problématique, ou contester la décision via un parcours dans le produit. Dans un nombre très limité de cas, nous pouvons aussi suspendre le compte du créateur en cas de comportement particulièrement grave.
Nous acceptons également les signalements humains de GPT problématiques. Si vous voyez un GPT qui, selon vous, enfreint nos politiques d’utilisation ou présente autrement du contenu problématique, vous pouvez aussi nous le signaler. Nous utilisons une combinaison de systèmes automatisés et une équipe d’experts formés pour examiner ces signalements.
