Koulutusdatan yhteenveto Kalifornian siviililain pykälän 3111 mukaisesti

OpenAI tarjoaa julkisesti saatavilla olevia generatiivisia AI-järjestelmiä Kalifornian osavaltiossa. Kehitämme näitä järjestelmiä käyttäen erilaisia tietolähteitä, kuten julkisesti saatavilla olevaa dataa, dataa, johon pääsemme käsiksi yhteistyössä kolmansien osapuolten kanssa, sekä tietoja, joita käyttäjämme tai ihmiskouluttajat ja tutkijat antavat tai tuottavat. Kehitämme järjestelmiämme myös synteettisen datan avulla.

Käytämme dataa auttaaksemme järjestelmiämme ymmärtämään paremmin ihmisten kieltä ja maailmaa. Tämä puolestaan mahdollistaa sen, että järjestelmämme voivat vahvistaa ihmisten luovuutta, edistää tieteellisiä löytöjä ja lääketieteellistä tutkimusta sekä auttaa satoja miljoonia ihmisiä parantamaan arkeaan. Järjestelmämme kehitetään tietoaineistoilla, jotka sisältävät biljoonia tokeneita teksti-, kuva-, ääni- ja audiovisuaalisesta sisällöstä.

Käytämme järjestelmiemme kehittämiseen monipuolista datajoukkoa, mukaan lukien dataa, joka voi olla tekijänoikeuden suojaamaa, ja public domainiin kuuluvaa dataa. Vaikka ryhdymme toimiin vähentääksemme henkilötietojen määrää koulutustietoaineistoissamme, osa datastamme voi sisältää henkilötietoja ja koottuja kuluttajatietoja Kalifornian siviililain pykälässä 1798.140 määritellyllä tavalla. Käyttäjämme voivat kieltää sisältönsä käyttämisen koulutukseen sekä pyytää tiettyjen henkilötietojen poistamista ChatGPT-vastauksista käyttämällä Tietosuojaportaaliamme. Käytämme erilaisia tekniikoita tietoaineistojemme käsittelyyn parantaaksemme malliemme suorituskykyä ja tarkkuutta.

Aloitimme datan keräämisen järjestelmiemme kehittämiseksi noin vuonna 2018, ja jatkamme datan keräämistä edelleen. Käytimme tietoaineistojamme ensimmäisen kerran järjestelmien kehittämiseen vuonna 2021.

Lisätietoja järjestelmiemme kehittämisestä löytyy järjestelmäkorteistamme.

Koulutusdatan yhteenveto Kalifornian siviililain pykälän 3111 mukaisesti

Oliko tästä artikkelista apua?