Apprenez-en plus sur la façon dont nous développons nos modèles et les appliquons dans des produits comme ChatGPT

Les modèles de fondation d’OpenAI, y compris les modèles qui alimentent ChatGPT, sont développés à partir de trois principales sources d’information : (1) les renseignements accessibles publiquement sur Internet, (2) les renseignements auxquels des tiers partenaires nous donnent accès, et (3) les renseignements que nos utilisateurs, formateurs humains et chercheurs fournissent ou génèrent.

Le développement de modèles de fondation comme ceux utilisés dans ChatGPT comporte plusieurs étapes, notamment la préparation des données d’entraînement, le pré-entraînement et le post-entraînement, ainsi que l’évaluation et l’amélioration continues après le déploiement. Différents types de renseignements peuvent être utilisés à ces étapes à diverses fins, notamment pour améliorer les performances, la fiabilité et la sécurité des modèles.

Cet article donne un aperçu des renseignements que nous utilisons pour contribuer au développement de ces modèles, de la façon dont nous les recueillons et les utilisons conformément aux lois sur la protection de la vie privée, ainsi que des mesures de protection que nous appliquons tout au long du processus d’entraînement. Pour comprendre comment nous recueillons et utilisons les renseignements provenant des utilisateurs de nos services, y compris comment refuser que les conversations ChatGPT servent à améliorer nos modèles, veuillez consulter notre politique de confidentialité et cet article du centre d’assistance.

Qu’est-ce que ChatGPT et comment fonctionne-t-il?

ChatGPT est un service fondé sur l’intelligence artificielle auquel vous pouvez accéder par Internet ou au moyen de l’application. Vous pouvez utiliser ChatGPT pour une vaste gamme de tâches, notamment organiser et résumer de l’information, aider à traduire, soutenir la programmation, la recherche et l’analyse, accomplir des tâches en plusieurs étapes dans différents outils, analyser ou générer des images, stimuler la créativité et les idées, ainsi que pour d’autres activités quotidiennes. ChatGPT est conçu pour comprendre les questions et les instructions des utilisateurs et y répondre en apprenant des motifs à partir de grandes quantités d’information, notamment du texte, des images, du son et de la vidéo.

Pendant l’entraînement, le modèle analyse les relations dans ces données — par exemple, la façon dont les mots apparaissent généralement ensemble en contexte — et utilise cette compréhension pour prédire le mot suivant le plus probable lorsqu’il génère une réponse, un mot à la fois. Le texte peut être converti en unités plus petites, parfois appelées « tokens », qui peuvent représenter des mots entiers, des parties de mots ou de la ponctuation. Les tokens sont les éléments de base du texte que le modèle traite. De même, les modèles qui génèrent d’autres formes de contenu, comme des images, apprennent des motifs dans la façon dont les pixels sont liés entre eux et aux légendes associées dans les données d’entraînement.

Par exemple, pendant le processus d’apprentissage du modèle (appelé « entraînement »), on pourrait lui demander de compléter une phrase comme : « Au lieu de tourner à gauche, elle a tourné ___. » Au début de l’entraînement, ses réponses sont en grande partie aléatoires. Cependant, à mesure que le modèle traite un grand volume de texte et en tire des apprentissages, il devient meilleur pour reconnaître les motifs et prédire le mot suivant le plus probable. Ce processus est répété sur des millions de phrases afin d’affiner sa compréhension et d’améliorer sa précision.

Comme il existe plusieurs façons plausibles de compléter une phrase — par exemple « Au lieu de tourner à gauche, elle a tourné à droite », « en rond » ou « en arrière » —, il y a une part inhérente d’aléatoire dans la manière dont le modèle répond. Par conséquent, une même question peut donner des réponses différentes d’une requête à l’autre.

Les modèles d’apprentissage automatique sont constitués de grands ensembles de nombres, appelés « poids » ou « paramètres », ainsi que de code qui interprète et utilise ces nombres. Ces modèles ne stockent ni ne conservent de copies des données sur lesquelles ils sont entraînés. À la place, à mesure qu’un modèle apprend, les valeurs de ses paramètres sont légèrement ajustées pour refléter les motifs qu’il a repérés. Dans l’exemple précédent, le modèle est passé de la prédiction de mots aléatoires à des prédictions plus exactes — non pas en stockant les phrases d’entraînement, mais en mettant à jour ses paramètres internes. Le modèle ne conserve pas de copies des phrases, des images ou des sons qu’il traite pendant l’entraînement. ChatGPT ne fait pas de « copier-coller » à partir de ses données d’entraînement — un peu comme une enseignante ou un enseignant qui, après une étude approfondie, peut expliquer des concepts en comprenant les relations entre les idées, sans mémoriser ni reproduire mot pour mot les documents d’origine. Lorsqu’il génère une réponse à la demande d’un utilisateur, le modèle utilise ces poids appris pour prédire et créer du nouveau contenu.

Quel type de renseignements sert à enseigner à ChatGPT?

Pour le contenu Internet accessible publiquement, nous utilisons seulement les renseignements qui sont accessibles librement et ouvertement sur Internet. Il peut s’agir de pages Web accessibles publiquement, de forums publics, de blogues publics, de publications publiques et d’autres contenus en ligne accessibles publiquement. Par exemple, si vous participez à un forum de discussion en ligne accessible publiquement ou publiez un billet de blogue public ou une autre publication publique, nous pouvons utiliser ce contenu accessible au public à des fins d’entraînement de modèles. Toutefois, nous prenons des mesures pour réduire le traitement des renseignements personnels dans notre processus d’entraînement. Lorsque nous recueillons du contenu Internet accessible publiquement, nous ne recueillons pas intentionnellement de données provenant de sources connues comme étant derrière des murs payants ou du Web clandestin. De plus, nous appliquons des filtres pour supprimer les contenus dont nous ne voulons pas que nos modèles apprennent, comme les discours haineux, le contenu pour adultes, les sites qui agrègent des renseignements personnels et les pourriels. Les renseignements restants sont ensuite utilisés pour entraîner nos modèles.

Les propriétaires de sites Web peuvent gérer l’accès au contenu accessible publiquement de leurs sites aux fins d’entraînement en utilisant des contrôles Web standards, comme robots.txt, pour interdire GPTBot, qui peut explorer du contenu accessible publiquement afin de contribuer à entraîner nos modèles. Nous fournissons des directives pour aider les propriétaires de sites Web à gérer la façon dont leurs sites et leur contenu interagissent avec nos systèmes d’IA.

Nous utilisons également des renseignements provenant de partenaires tiers pour aider à entraîner et à améliorer nos modèles. Cela peut comprendre des renseignements dans des ensembles de données auxquels nous avons accès en vertu d’ententes avec des tiers, ainsi que des renseignements fournis ou générés par des formateurs humains et des chercheurs lorsque nos politiques et ententes le permettent. Cela contribue à améliorer la qualité, la sécurité et les performances de nos modèles. Ces sources peuvent comprendre du texte, des images, du son, de la vidéo ou d’autres types de données, selon l’ensemble de données.

Nous utilisons aussi de plus en plus des données synthétiques dans certains processus d’entraînement. Par exemple, nous pouvons utiliser de l’information et nos modèles pour générer des invites synthétiques, des exemples multilingues ou d’autres documents d’entraînement. Les données synthétiques peuvent aider à améliorer les performances des modèles, notamment en complétant les données d’entraînement dans des domaines où elles sont rares ou déséquilibrées, et peuvent aussi soutenir des approches de développement de modèles qui renforcent la protection de la vie privée.

Des renseignements personnels servent-ils à enseigner à ChatGPT?

Une part importante du contenu en ligne porte sur des personnes; nos données d’entraînement peuvent donc inclure fortuitement des renseignements personnels. Toutefois, nous prenons des mesures pour réduire le traitement des renseignements personnels dans notre processus d’entraînement.

Nous utilisons les données d’entraînement pour développer les capacités du modèle — comme la prédiction, le raisonnement et la résolution de problèmes — et non pour établir des profils de personnes, communiquer avec elles ou leur présenter des publicités personnalisées.

Dans certains cas, les modèles peuvent apprendre à partir de renseignements personnels pour comprendre le fonctionnement d’éléments comme les noms et les adresses dans la langue, ou pour reconnaître des personnalités publiques et des entités bien connues. Cela aide le modèle à générer des réponses plus exactes et adaptées au contexte.

Comment les renseignements personnels sont-ils protégés pendant l’entraînement?

Nous prenons des mesures actives pour limiter le traitement des renseignements personnels pendant l’entraînement. Par exemple, nous excluons les sources connues qui agrègent de grandes quantités de données personnelles, appliquons des filtres pour réduire les renseignements personnels dans le processus d’entraînement et prenons des mesures pour repérer et supprimer le contenu en double afin de réduire le risque de répétition des données d’entraînement. De plus, nous entraînons nos modèles à éviter de répondre aux demandes de renseignements privés ou sensibles au sujet de personnes.

Durée de conservation des renseignements

Nous conservons les renseignements contenus dans les données d’entraînement seulement aussi longtemps qu’il est raisonnablement nécessaire aux fins décrites dans le présent article et dans notre politique de confidentialité, notamment pour développer et améliorer nos modèles et à des fins de recherche scientifique connexes. La conservation fait l’objet d’un examen périodique afin de s’assurer qu’elle demeure nécessaire, et varie selon le type de renseignements et la façon dont ils sont utilisés. Pour déterminer la durée de conservation, nous tenons compte de facteurs comme l’objectif du traitement des renseignements, la quantité, la nature et la sensibilité des renseignements, le risque potentiel de préjudice lié à une utilisation ou à une divulgation non autorisée, ainsi que toute obligation légale à laquelle nous sommes assujettis.

Comment le développement de ChatGPT respecte-t-il les lois sur la protection de la vie privée?

Nous utilisons les renseignements d’entraînement de manière légale. Nos modèles de fondation alimentent un large éventail d’applications utiles, notamment des outils d’accessibilité, le soutien à la clientèle, le développement logiciel, l’éducation personnalisée et la recherche scientifique. Ces capacités reposent sur des données d’entraînement à grande échelle, notamment des renseignements accessibles publiquement et des renseignements provenant de partenaires tiers. Nous appliquons des mesures de protection tout au long du processus d’entraînement, y compris des mesures conçues pour réduire le traitement des renseignements personnels dans ce processus et pour atténuer les risques, comme il est décrit dans le présent article. Nous fondons la collecte et l’utilisation des renseignements personnels inclus dans les renseignements d’entraînement sur des intérêts légitimes prévus par les lois sur la protection de la vie privée, comme le RGPD, notamment pour entraîner et améliorer nos modèles au profit des utilisateurs et de la société dans son ensemble, conformément à notre mission de veiller à ce que l’intelligence artificielle générale profite à tout le monde, comme l’explique plus en détail notre politique de confidentialité. Nous avons réalisé une analyse d’impact relative à la protection des données afin de nous assurer que nous recueillons et utilisons ces renseignements de manière légale et responsable.

Quand les renseignements peuvent être partagés ou transférés

Nous ne « vendons » pas les renseignements personnels et ne divulguons les renseignements personnels contenus dans les données d’entraînement que dans les circonstances limitées décrites dans notre politique de confidentialité. Par exemple, nous pouvons partager des renseignements avec des sociétés affiliées, des fournisseurs et des prestataires de services qui soutiennent le développement, les tests et l’amélioration de nos modèles. Nous pouvons également divulguer des renseignements lorsque nous croyons de bonne foi qu’une telle mesure est nécessaire pour respecter une obligation légale ou pour protéger nos droits, notre sûreté et notre sécurité, ainsi que ceux de nos utilisateurs, de nos employés ou du public, comme il est décrit dans notre politique de confidentialité.

Comme notre infrastructure est mondiale, les renseignements personnels contenus dans les données d’entraînement peuvent être traités dans des pays situés à l’extérieur de l’EEE, de la Suisse ou du Royaume-Uni (y compris aux États-Unis). Lorsque cela se produit, nous appliquons des mesures de protection appropriées, comme des décisions d’adéquation ou des clauses contractuelles types, comme il est décrit dans notre politique de confidentialité.

Vos droits et la façon de les exercer

Nous répondons aux demandes d’opposition et aux demandes similaires visant l’exercice de droits. Comme ChatGPT apprend le langage, ses réponses peuvent parfois inclure des renseignements personnels au sujet de personnes dont les renseignements personnels apparaissent plusieurs fois sur l’Internet public (par exemple, des personnalités publiques). Les personnes se trouvant dans certains territoires peuvent s’opposer au traitement de leurs renseignements personnels par nos modèles ou présenter d’autres demandes visant l’exercice de droits des personnes concernées par l’intermédiaire de notre Portail de confidentialité. Vous pouvez également exercer ces droits en écrivant à privacy@openai.com.

Pour nous aider à évaluer votre demande et à y répondre, veuillez fournir suffisamment de renseignements pour que nous comprenions à quels renseignements personnels elle se rapporte, comme votre nom, les URL pertinentes, des exemples précis de sorties de modèles ou d’autres détails qui aident à cerner le problème. Dans certains cas, nous pouvons vous demander de vérifier votre identité ou de confirmer que les renseignements vous concernent avant de pouvoir agir. Vous trouverez de plus amples renseignements sur la façon de présenter ces demandes, y compris les pratiques exemplaires et la manière dont les demandes sont examinées, dans notre article du centre d’assistance sur la suppression des données personnelles de ChatGPT. Nous examinons les demandes conformément aux lois applicables sur la protection de la vie privée et répondons dans les délais légaux applicables.

Veuillez noter que, conformément aux lois sur la protection de la vie privée, certains droits peuvent ne pas être absolus. Par exemple, il se peut que nous ne puissions pas donner suite à une demande lorsque nous ne pouvons pas vérifier les renseignements pertinents, lorsque la demande ne concerne pas des renseignements personnels traités par OpenAI, lorsqu’une exception s’applique ou lorsque nous avons une autre raison légale de le faire. Les demandes sont évaluées au cas par cas et peuvent nécessiter de mettre en balance les droits à la vie privée avec d’autres considérations importantes, comme la liberté d’expression et l’intérêt public.

Toutefois, nous nous efforçons de prioriser la protection des renseignements personnels et de respecter toutes les lois applicables sur la protection de la vie privée. Si vous estimez que nous n’avons pas traité adéquatement un problème, vous avez le droit de déposer une plainte auprès de votre autorité de contrôle locale.

Pour en savoir plus sur les pratiques d’OpenAI concernant les renseignements personnels que nous recueillons auprès de vous ou à votre sujet lorsque vous utilisez notre site Web, nos applications et nos services, veuillez consulter notre politique de confidentialité.

Comment ChatGPT et nos modèles de base sont développés

Qu’est-ce que ChatGPT et comment fonctionne-t-il?

Quel type de renseignements sert à enseigner à ChatGPT?

Des renseignements personnels servent-ils à enseigner à ChatGPT?

Comment le développement de ChatGPT respecte-t-il les lois sur la protection de la vie privée?

Cet article vous a-t-il été utile?