| Notă : Păstrarea datelor pentru anumite servicii poate fi afectată de evoluții juridice recente – consultați articolul nostru de blog pentru mai multe detalii. |
|---|
Modelele fundamentale ale OpenAI, inclusiv modelele care stau la baza ChatGPT, sunt dezvoltate folosind trei surse principale de informații: (1) informații disponibile public pe internet, (2) informații la care avem acces prin parteneriate cu terți și (3) informații pe care utilizatorii, instructorii umani și cercetătorii noștri le furnizează sau le generează.
Acest articol oferă o prezentare generală a informațiilor disponibile public pe care le folosim pentru a contribui la dezvoltarea acestor modele și a modului în care colectăm și folosim aceste informații în conformitate cu legile privind confidențialitatea. Pentru a înțelege cum colectăm și folosim informațiile de la utilizatorii serviciilor noastre, inclusiv cum puteți refuza ca conversațiile ChatGPT să fie folosite pentru a contribui la instruirea modelelor noastre, consultați Politica noastră de confidențialitate și acest articol din centrul de ajutor.
Ce este ChatGPT și cum funcționează?
ChatGPT este un serviciu bazat pe inteligență artificială pe care îl puteți accesa prin internet. Puteți folosi ChatGPT pentru o gamă largă de sarcini, inclusiv organizarea și rezumarea informațiilor, asistență la traduceri, analizarea sau generarea de imagini, stimularea creativității și a ideilor, precum și alte activități de zi cu zi. ChatGPT este conceput să înțeleagă și să răspundă la întrebările și instrucțiunile utilizatorilor prin învățarea tiparelor din cantități mari de informații, inclusiv text, imagini, audio și video. În timpul instruirii, modelul analizează relațiile din cadrul acestor date—cum ar fi modul în care cuvintele apar de obicei împreună în context—și folosește această înțelegere pentru a prezice următorul cuvânt cel mai probabil atunci când generează un răspuns, câte un cuvânt pe rând. În mod similar, modelele care generează alte forme de conținut, cum ar fi imaginile, învață tipare privind modul în care pixelii se raportează unii la alții și la subtitrările asociate din datele de instruire.
De exemplu, în timpul procesului de învățare al modelului (cunoscut drept „instruire”), modelului i s-ar putea cere să completeze o propoziție precum: „În loc să vireze la stânga, ea a virat ___.” La începutul instruirii, răspunsurile sale sunt în mare parte aleatorii. Totuși, pe măsură ce modelul procesează și învață dintr-un volum mare de text, devine mai bun la recunoașterea tiparelor și la prezicerea celui mai probabil cuvânt următor. Acest proces este repetat pe milioane de propoziții pentru a-i rafina înțelegerea și a-i îmbunătăți acuratețea.
Deoarece există mai multe moduri plauzibile de a completa o propoziție—cum ar fi „În loc să vireze la stânga, ea a virat la dreapta”, „înapoi” sau „s-a întors”—există un element inerent de aleatoriu în modul în care răspunde modelul. Drept urmare, aceeași întrebare poate genera răspunsuri diferite în interogări diferite.
Modelele de învățare automată constau în seturi mari de numere, cunoscute ca „ponderi” sau „parametri”, împreună cu cod care interpretează și folosește acele numere. Aceste modele nu stochează și nu păstrează copii ale datelor pe care sunt instruite. În schimb, pe măsură ce un model învață, valorile parametrilor săi sunt ajustate ușor pentru a reflecta tiparele pe care le-a identificat. În exemplul anterior, modelul a progresat de la prezicerea unor cuvinte aleatorii la realizarea unor predicții mai exacte—nu prin stocarea propozițiilor de instruire, ci prin actualizarea parametrilor săi interni. Modelul nu păstrează copii ale propozițiilor, imaginilor sau materialelor audio pe care le procesează în timpul instruirii. ChatGPT nu „copiază și lipește” din datele sale de instruire—similar modului în care un profesor, după un studiu aprofundat, poate explica concepte înțelegând relațiile dintre idei fără a memora sau reproduce textual materialele originale. Atunci când generează un răspuns la o solicitare a utilizatorului, modelul folosește aceste ponderi învățate pentru a prezice și a crea conținut nou.
Ce tip de informații publice se folosesc pentru instruirea ChatGPT?
Pentru conținutul disponibil public pe internet, folosim doar informații accesibile liber și deschis pe internet. Nu colectăm în mod intenționat date din surse despre care se știe că se află în spatele unor sisteme cu plată sau de pe dark web. În plus, aplicăm filtre pentru a elimina materialele din care nu dorim ca modelele noastre să învețe, cum ar fi discursul instigator la ură, conținutul pentru adulți, site-urile care agregă informații personale și spamul. Informațiile rămase sunt apoi folosite pentru a ne instrui modelele.
Sunt folosite informații personale pentru instruirea ChatGPT?
O parte semnificativă a conținutului online implică informații despre persoane, astfel că datele noastre de instruire pot include incidental informații personale. Totuși, nu colectăm în mod intenționat informații personale în scopul instruirii modelelor noastre.
Folosim datele de instruire pentru a dezvolta capacitățile modelului—cum ar fi predicția, raţionamentul și rezolvarea problemelor—nu pentru a crea profiluri de utilizator, a contacta persoane sau ca parte a eforturilor noastre de publicitate ori marketing.
În unele cazuri, modelele pot învăța din informații personale pentru a înțelege cum funcționează în limbaj elemente precum numele și adresele sau pentru a recunoaște persoane publice și entități bine-cunoscute. Acest lucru ajută modelul să genereze răspunsuri mai exacte și adecvate contextului.
Luăm măsuri active pentru a limita prelucrarea informațiilor personale în timpul instruirii. De exemplu, excludem sursele care agregă cantități mari de date personale și ne instruim modelele să evite să răspundă la solicitări de informații private sau sensibile despre persoane.
Cum respectă dezvoltarea ChatGPT legile privind confidențialitatea?
Folosim informațiile de instruire în mod legal. Modelele noastre fundamentale alimentează o gamă largă de aplicații benefice—de la crearea de conținut și asistența pentru clienți până la dezvoltarea de software, educația personalizată și cercetarea științifică. Aceste capacități depind de date de instruire la scară largă. Informațiile folosite pentru a ne instrui modelele sunt disponibile public și nu sunt destinate să provoace prejudicii persoanelor. Ne bazăm colectarea și utilizarea informațiilor personale incluse în informațiile de instruire pe interese legitime în temeiul legilor privind confidențialitatea, precum GDPR, după cum se explică mai detaliat în Politica noastră de confidențialitate. Am finalizat o evaluare a impactului asupra protecției datelor pentru a contribui la asigurarea faptului că aceste informații sunt colectate și utilizate de noi în mod legal și responsabil.
Răspundem solicitărilor de opoziție și drepturilor similare. Ca urmare a învățării limbajului, răspunsurile ChatGPT pot include uneori informații personale despre persoane ale căror informații personale apar de mai multe ori pe internetul public (de exemplu, persoane publice). Persoanele din anumite jurisdicții se pot opune prelucrării informațiilor lor personale de către modelele noastre sau pot formula alte solicitări privind drepturile persoanelor vizate prin Portalul de confidențialitate. De asemenea, vă puteți exercita aceste drepturi contactând dsar@openai.com.
Vă rugăm să aveți în vedere că, în conformitate cu legile privind confidențialitatea, unele drepturi pot să nu fie absolute. Putem refuza o solicitare dacă avem un motiv legal pentru a face acest lucru. Cu toate acestea, ne străduim să acordăm prioritate protejării informațiilor personale și să respectăm toate legile aplicabile privind confidențialitatea. Dacă considerați că nu am abordat în mod adecvat o problemă, aveți dreptul să depuneți o plângere la autoritatea locală de supraveghere.
Pentru mai multe informații despre practicile OpenAI privind informațiile personale pe care le colectăm de la dvs. sau despre dvs. atunci când utilizați site-ul, aplicațiile și serviciile noastre, consultați Politica noastră de confidențialitate.
