OpenAI Kalifornijos valstijoje siūlo viešai prieinamas generatyvines AI sistemas. Šias sistemas kuriame naudodami įvairius duomenų šaltinius, įskaitant viešai prieinamus duomenis, duomenis, prie kurių prieigą gauname bendradarbiaudami su trečiosiomis šalimis, ir informaciją, kurią pateikia arba sugeneruoja mūsų naudotojai, žmonės instruktoriai ir tyrėjai. Savo sistemas taip pat kuriame naudodami sintetinius duomenis.
Duomenis naudojame tam, kad mūsų sistemos geriau suprastų žmonių kalbą ir pasaulį. Tai savo ruožtu leidžia mūsų sistemoms stiprinti žmonių kūrybiškumą, skatinti mokslinius atradimus ir medicininius tyrimus bei suteikti šimtams milijonų žmonių galimybę pagerinti kasdienį gyvenimą. Mūsų sistemos kuriamos naudojant duomenų rinkinius, kuriuose yra trilijonai tekstinio, vaizdinio, garsinio ir audiovizualinio turinio žetonų.
Savo sistemoms kurti naudojame įvairų duomenų rinkinį, įskaitant duomenis, kurie gali būti saugomi autorių teisių, ir viešosios srities duomenis. Nors imamės priemonių asmeninės informacijos kiekiui savo mokymo duomenų rinkiniuose sumažinti, kai kuriuose mūsų duomenyse gali būti asmeninės informacijos ir suvestinės vartotojų informacijos, kaip apibrėžta Kalifornijos civilinio kodekso 1798.140 skirsnyje. Mūsų naudotojai gali atsisakyti, kad jų turinys būtų naudojamas mokymui, taip pat prašyti pašalinti tam tikrą asmeninę informaciją iš ChatGPT atsakymų, naudodamiesi mūsų Privatumo portalu. Savo duomenų rinkiniams apdoroti taikome įvairius metodus, kad pagerintume savo modelių veikimą ir tikslumą.
Duomenis savo sistemoms kurti pradėjome rinkti maždaug 2018 m. ir juos renkame iki šiol. Pirmą kartą savo duomenų rinkinius sistemų kūrimui panaudojome 2021 m.
Papildomos informacijos apie mūsų sistemų kūrimą galima rasti mūsų sistemos kortelėse.
Mokymo duomenų santrauka pagal Kalifornijos civilinio kodekso 3111 skirsnį
Atnaujinta: 11 days ago
