OpenAI biedt openbaar beschikbare generatieve AI-systemen aan in de staat Californië. We ontwikkelen deze systemen met behulp van verschillende databronnen, waaronder openbaar beschikbare gegevens, gegevens waartoe we in samenwerking met derden toegang krijgen, en informatie die onze gebruikers of menselijke trainers en onderzoekers verstrekken of genereren. We ontwikkelen onze systemen ook met synthetische data.
We gebruiken data om onze systemen menselijke taal en de wereld beter te laten begrijpen. Daardoor kunnen onze systemen op hun beurt menselijke creativiteit versterken, wetenschappelijke ontdekkingen en medisch onderzoek bevorderen en honderden miljoenen mensen in staat stellen hun dagelijks leven te verbeteren. Onze systemen worden ontwikkeld op datasets die biljoenen tokens aan tekstuele, beeld-, audio- en audiovisuele content bevatten.
We gebruiken een diverse reeks data om onze systemen te ontwikkelen, waaronder data die mogelijk auteursrechtelijk beschermd is en data in het publieke domein. Hoewel we stappen ondernemen om de hoeveelheid persoonlijke informatie in onze trainingsdatasets te verminderen, kunnen sommige van onze data persoonlijke informatie en geaggregeerde consumenteninformatie bevatten zoals gedefinieerd in California Civil Code Section 1798.140. Onze gebruikers kunnen ervoor kiezen dat hun content niet wordt gebruikt voor training, en kunnen ook verzoeken om verwijdering van bepaalde persoonlijke informatie uit ChatGPT-antwoorden via ons privacy-portaal. We gebruiken verschillende technieken om onze datasets te verwerken en zo de prestaties en nauwkeurigheid van onze modellen te verbeteren.
We zijn rond 2018 begonnen met het verzamelen van data om onze systemen te ontwikkelen, en we verzamelen ook vandaag nog data. We hebben onze datasets in 2021 voor het eerst gebruikt voor systeemontwikkeling.
Aanvullende informatie over de ontwikkeling van onze systemen is te vinden in onze systeemkaarten.
Samenvatting van trainingsdata volgens California Civil Code Section 3111
Bijgewerkt: 14 hours ago
