Súhrn tréningových údajov podľa § 3111 kalifornského občianskeho zákonníka

OpenAI ponúka v štáte Kalifornia verejne dostupné generatívne systémy AI. Tieto systémy vyvíjame s použitím rôznych zdrojov údajov vrátane verejne dostupných údajov, údajov, ku ktorým získavame prístup v spolupráci s tretími stranami, a informácií, ktoré poskytujú alebo vytvárajú naši používatelia či ľudskí školitelia a výskumníci. Naše systémy vyvíjame aj s použitím syntetických údajov.

Údaje používame na to, aby sme našim systémom pomohli lepšie porozumieť ľudskej reči a svetu. To následne umožňuje našim systémom podporovať ľudskú tvorivosť, posúvať vedecké objavy a lekársky výskum a umožniť stovkám miliónov ľudí zlepšovať svoj každodenný život. Naše systémy sa vyvíjajú na súboroch údajov obsahujúcich bilióny tokenov textového, obrazového, zvukového a audiovizuálneho obsahu.

Na vývoj našich systémov používame rozmanitý súbor údajov vrátane údajov, ktoré môžu byť chránené autorským právom, a údajov vo verejnej doméne. Hoci podnikáme kroky na zníženie množstva osobných údajov v našich tréningových súboroch údajov, niektoré naše údaje môžu zahŕňať osobné údaje a súhrnné informácie o spotrebiteľoch v zmysle definície v oddiele 1798.140 Kalifornského občianskeho zákonníka. Naši používatelia majú možnosť nesúhlasiť s používaním svojho obsahu na tréning, ako aj požiadať o odstránenie určitých osobných údajov z odpovedí ChatGPT, a to prostredníctvom nášho Portálu ochrany súkromia. Na spracovanie našich súborov údajov používame rôzne techniky s cieľom zlepšiť výkon a presnosť našich modelov.

Údaje na vývoj našich systémov sme začali zhromažďovať približne v roku 2018 a zhromažďujeme ich aj naďalej. Naše súbory údajov sme prvýkrát použili na vývoj systémov v roku 2021.

Ďalšie informácie o vývoji našich systémov nájdete v našich systémových kartách.

Súhrn tréningových údajov podľa § 3111 kalifornského občianskeho zákonníka

Bol tento článok užitočný?