OpenAI offre des systèmes d’IA générative accessibles au public dans l’État de Californie. Nous développons ces systèmes à l’aide de diverses sources de données, y compris des données accessibles au public, des données auxquelles nous accédons en partenariat avec des tiers, ainsi que des renseignements que nos utilisateurs ou des formateurs et chercheurs humains fournissent ou génèrent. Nous développons également nos systèmes à l’aide de données synthétiques.
Nous utilisons des données pour aider nos systèmes à mieux comprendre le langage humain et le monde. Cela permet à nos systèmes, en retour, de stimuler la créativité humaine, de faire progresser les découvertes scientifiques et la recherche médicale, et de permettre à des centaines de millions de personnes d’améliorer leur vie quotidienne. Nos systèmes sont développés à partir d’ensembles de données contenant des billions de tokens de contenu textuel, image, audio et audiovisuel.
Nous utilisons un ensemble diversifié de données pour développer nos systèmes, y compris des données pouvant être protégées par le droit d’auteur et des données du domaine public. Bien que nous prenions des mesures pour réduire la quantité de renseignements personnels dans nos ensembles de données d’entraînement, certaines de nos données peuvent inclure des renseignements personnels et des renseignements agrégés sur les consommateurs, au sens de l’article 1798.140 du Code civil de la Californie. Nos utilisateurs peuvent refuser que leur contenu soit utilisé pour l’entraînement, ainsi que demander la suppression de certains renseignements personnels des réponses de ChatGPT, au moyen de notre Portail de confidentialité. Nous utilisons diverses techniques pour traiter nos ensembles de données afin d’améliorer la performance et l’exactitude de nos modèles.
Nous avons commencé à recueillir des données pour développer nos systèmes vers 2018, et nous continuons d’en recueillir aujourd’hui. Nous avons d’abord utilisé nos ensembles de données pour le développement de systèmes en 2021.
Des renseignements supplémentaires sur le développement de nos systèmes se trouvent dans nos fiches système.
Résumé des données d’entraînement conformément à l’article 3111 du Code civil de la Californie
Mise à jour : 7 days ago
