Credem în dezvoltarea și implementarea responsabile și iterative ca mijloc de a obține o inteligență generală artificială sigură. Efectuăm un volum considerabil de testare și atenuare pentru siguranță și aliniere înainte de a lansa vreodată un model publicului și avem, de asemenea, sisteme automatizate și umane pentru a ajuta la detectarea conținutului problematic care apare în serviciile noastre pentru persoane fizice, cum ar fi ChatGPT și GPT-urile. Prezentăm mai jos câteva dintre aceste eforturi.

ChatGPT și ImageGen

Folosim instrumente automatizate, cum ar fi o versiune internă a /moderations API, pentru a detecta conținutul (solicitări, completări, încărcări) care poate fi dăunător sau poate încălca Politicile noastre de utilizare. Dacă detectăm conținut problematic, de obicei fie te vom avertiza că acest conținut poate încălca politicile noastre de utilizare, fie vom bloca modelul să răspundă la solicitarea ta. De asemenea, putem împiedica distribuirea chatului cu solicitarea sau completarea problematică. Într-un set foarte limitat de circumstanțe, îți putem interzice și contul pentru comportament flagrant.

Acceptăm și raportări din partea oamenilor privind conținut problematic pe ChatGPT. Folosim o combinație de sisteme automatizate și o echipă instruită de experți pentru a examina aceste raportări.

ChatGPT: Dacă cineva distribuie un chat despre care crezi că include conținut problematic, poți, de asemenea, să ni-l raportezi.

Pentru mai multe detalii despre cum să raportezi conținut direct în ChatGPT, consultă acest articol.

GPT-uri

Folosim și instrumente automatizate, cum ar fi /moderation API, pentru a vedea dacă un GPT este potențial problematic. Dacă detectăm conținut problematic asociat cu GPT-ul, vom lua măsuri, cum ar fi împiedicarea distribuirii acestuia. Creatorul poate edita configurația GPT-ului sau a API-ului pentru a elimina conținutul problematic sau poate contesta decizia printr-un flux din produs. Într-un set foarte limitat de circumstanțe, putem interzice și contul creatorului pentru comportament flagrant.

Acceptăm și raportări din partea oamenilor privind GPT-uri problematice. Dacă vezi un GPT despre care crezi că încalcă politicile noastre de utilizare sau reflectă în alt mod conținut problematic, poți, de asemenea, să ni-l raportezi. Folosim o combinație de sisteme automatizate și o echipă instruită de experți pentru a examina aceste raportări.

Cum identificăm conținutul problematic pe serviciile noastre pentru persoane fizice

ChatGPT și ImageGen

GPT-uri

A fost util acest articol?