OpenAI nyilvánosan elérhető generatív MI-rendszereket kínál Kalifornia államban. Ezeket a rendszereket különféle adatforrások felhasználásával fejlesztjük, ideértve a nyilvánosan elérhető adatokat, azokat az adatokat, amelyekhez harmadik felekkel együttműködve férünk hozzá, valamint azokat az információkat, amelyeket felhasználóink, emberi trénereink és kutatóink biztosítanak vagy hoznak létre. Rendszereinket szintetikus adatok felhasználásával is fejlesztjük.
Az adatokat arra használjuk, hogy rendszereink jobban megértsék az emberi nyelvet és a világot. Ez pedig lehetővé teszi, hogy rendszereink fokozzák az emberi kreativitást, előmozdítsák a tudományos felfedezéseket és az orvosi kutatást, valamint emberek százmillióinak tegyék lehetővé mindennapi életük javítását. Rendszereinket olyan adatkészleteken fejlesztjük, amelyek szöveges, képi, hang- és audiovizuális tartalmak tokenjeinek billióit tartalmazzák.
Rendszereink fejlesztéséhez sokféle adatot használunk, köztük szerzői jog által védett és közkincsnek minősülő adatokat is. Bár lépéseket teszünk a személyes adatok mennyiségének csökkentésére a tanítási adatkészleteinkben, egyes adataink tartalmazhatnak személyes adatokat és összesített fogyasztói információkat a kaliforniai polgári törvénykönyv 1798.140. szakaszában meghatározottak szerint. Felhasználóink az Adatvédelmi portál használatával letilthatják tartalmaik tanításhoz való felhasználását, valamint kérhetik bizonyos személyes adatok eltávolítását a ChatGPT válaszaiból. Adatkészleteink feldolgozásához különféle technikákat alkalmazunk modelljeink teljesítményének és pontosságának javítása érdekében.
Rendszereink fejlesztéséhez hozzávetőlegesen 2018-ban kezdtünk adatokat gyűjteni, és ezt ma is folytatjuk. Adatkészleteinket először 2021-ben használtuk rendszerek fejlesztésére.
A rendszereink fejlesztéséről további információk a rendszerkártyáinkban találhatók.
A tanítási adatok összefoglalója a kaliforniai polgári törvénykönyv 3111. szakasza szerint
Frissítve: 13 days ago
