OpenAI

Sintesi dei dati di addestramento ai sensi della Sezione 3111 del Codice Civile della California

Aggiornato: 13 days ago

OpenAI offre sistemi di IA generativa disponibili al pubblico nello stato della California. Sviluppiamo questi sistemi utilizzando una varietà di fonti di dati, inclusi dati pubblicamente disponibili, dati a cui accediamo tramite partnership con terze parti e informazioni fornite o generate dai nostri utenti, formatori umani e ricercatori. Inoltre sviluppiamo i nostri sistemi utilizzando dati sintetici.


Utilizziamo i dati per aiutare i nostri sistemi a comprendere meglio il linguaggio umano e il mondo. Questo, a sua volta, consente ai nostri sistemi di potenziare la creatività umana, far progredire la scoperta scientifica e la ricerca medica, e consentire a centinaia di milioni di persone di migliorare la propria vita quotidiana. I nostri sistemi sono sviluppati su set di dati contenenti trilioni di token di contenuti testuali, visivi, audio e audiovisivi.


Utilizziamo un insieme diversificato di dati per sviluppare i nostri sistemi, inclusi quelli protetti da copyright e quelli di pubblico dominio. Sebbene adottiamo misure per ridurre la quantità di informazioni personali nei nostri set di dati di addestramento, alcuni dati possono includere informazioni personali e aggregate sui consumatori, come definite nella Sezione 1798.140 del Codice Civile della California. I nostri utenti possono opporsi all'uso dei propri contenuti per l'addestramento e richiedere la rimozione di alcune informazioni personali dalle risposte di ChatGPT tramite il nostro Portale della privacy. Utilizziamo una serie di tecniche per elaborare i nostri set di dati al fine di migliorare le prestazioni e l'accuratezza dei nostri modelli.


Abbiamo iniziato a raccogliere dati per sviluppare i nostri sistemi intorno al 2018 e continuiamo a raccogliere dati ancora oggi. Abbiamo utilizzato per la prima volta i nostri set di dati per lo sviluppo dei sistemi nel 2021.


Ulteriori informazioni sullo sviluppo dei nostri sistemi sono disponibili nelle nostre schede di sistema.

Questo articolo è stato utile?