OpenAI
Tato stránka byla přeložena strojově. Zobrazit původní článek v angličtině.

Souhrn tréninkových dat podle oddílu 3111 občanského zákoníku státu Kalifornie

Aktualizováno: 14 hours ago

OpenAI nabízí ve státě Kalifornie veřejně dostupné generativní systémy AI. Tyto systémy vyvíjíme s využitím různých zdrojů dat, včetně veřejně dostupných dat, dat, ke kterým přistupujeme ve spolupráci s třetími stranami, a informací, které poskytují nebo vytvářejí naši uživatelé či lidští školitelé a výzkumníci. Naše systémy také vyvíjíme s využitím syntetických dat.


Používáme data, aby naše systémy lépe rozuměly lidskému jazyku a světu. To našim systémům následně umožňuje posilovat lidskou kreativitu, podporovat vědecké objevy a lékařský výzkum a pomáhat stovkám milionů lidí zlepšovat jejich každodenní život. Naše systémy jsou vyvíjeny na datových sadách obsahujících biliony tokenů textového, obrazového, zvukového a audiovizuálního obsahu.


K vývoji našich systémů používáme rozmanitou sadu dat, včetně dat, která mohou být chráněna autorským právem, i dat, která jsou volným dílem. Přestože podnikáme kroky ke snížení množství osobních údajů v našich tréninkových datových sadách, některá naše data mohou zahrnovat osobní údaje a souhrnné informace o spotřebitelích, jak jsou definovány v oddílu 1798.140 občanského zákoníku státu Kalifornie. Naši uživatelé mají možnost odmítnout použití svého obsahu pro trénování a také požádat o odstranění určitých osobních údajů z odpovědí ChatGPT prostřednictvím našeho Portálu ochrany osobních údajů. Ke zpracování našich datových sad používáme různé techniky za účelem zlepšení výkonu a přesnosti našich modelů.


Data pro vývoj našich systémů jsme začali shromažďovat přibližně v roce 2018 a shromažďujeme je dodnes. Naše datové sady jsme poprvé použili pro vývoj systémů v roce 2021.


Další informace o vývoji našich systémů naleznete v našich kartách systému.

Byl tento článek užitečný?