OpenAI

Résumé des données d'entraînement conformément à l'article 3111 du Code civil de Californie

Dernière mise à jour : 2 days ago

OpenAI propose des systèmes d'IA générative accessibles au public dans l'État de Californie. Nous développons ces systèmes à l'aide de diverses sources de données, notamment des données accessibles au public, des données auxquelles nous accédons grâce à des partenariats avec des tiers, ainsi que des informations que nos utilisateurs, formateurs humains et chercheurs fournissent ou génèrent. Nous développons également nos systèmes à l'aide de données synthétiques.


Nous utilisons des données pour aider nos systèmes à mieux comprendre le langage humain et le monde. Cela, à son tour, permet à nos systèmes de stimuler la créativité humaine, de faire progresser la découverte scientifique et la recherche médicale, et de permettre à des centaines de millions de personnes d'améliorer leur quotidien. Nos systèmes sont développés à partir de jeux de données contenant des milliers de milliards de tokens de contenus textuels, visuels, audio et audiovisuels.


Nous utilisons un ensemble diversifié de données pour développer nos systèmes, y compris des données susceptibles d'être protégées par le droit d'auteur et des données relevant du domaine public. Bien que nous prenions des mesures pour réduire la quantité d'informations personnelles dans nos ensembles de données d'entraînement, certaines de nos données peuvent inclure des informations personnelles et des informations agrégées sur les consommateurs, telles que définies dans la section 1798.140 du Code civil de Californie. Nos utilisateurs ont la possibilité de désactiver l'utilisation de leur contenu à des fins d'entraînement et de demander la suppression de certaines informations personnelles des réponses de ChatGPT via notre Portail de confidentialité. Nous utilisons une variété de techniques pour traiter nos jeux de données afin d'améliorer les performances et la précision de nos modèles.


Nous avons commencé à collecter des données vers 2018 afin de développer nos systèmes, et nous continuons à collecter des données aujourd'hui. Nous avons utilisé pour la première fois nos jeux de données pour le développement de systèmes en 2021.


Des informations complémentaires sur le développement de nos systèmes sont disponibles dans nos fiches système.

Cet article vous a-t-il été utile ?