Credem în dezvoltarea și implementarea responsabilă, iterativă, ca mijloc de a obține inteligență generală artificială sigură. Efectuăm o cantitate considerabilă de testare și atenuare privind siguranța și alinierea înainte de a lansa vreodată un model pentru public și avem, de asemenea, sisteme automate și umane care ajută la detectarea conținutului problematic care apare pe serviciile noastre pentru persoane fizice, cum ar fi ChatGPT și GPTs. Prezentăm mai jos câteva dintre aceste eforturi.
ChatGPT, ImageGen și SORA
Folosim instrumente automate, cum ar fi o versiune internă a API-ului nostru /moderations, pentru a detecta conținut (solicitări, completări, încărcări) care poate fi dăunător sau poate încălca politicile noastre de utilizare. Dacă detectăm conținut problematic, de obicei fie vă avertizăm că respectivul conținut ar putea încălca politicile noastre de utilizare, fie blocăm modelul să răspundă la solicitarea dvs. De asemenea, putem împiedica distribuirea conversației cu solicitarea sau completarea problematică. Într-un set foarte limitat de circumstanțe, putem de asemenea să vă suspendăm contul pentru comportament grav.
Acceptăm și raportări umane privind conținut problematic în ChatGPT și SORA. Folosim o combinație de sisteme automate și o echipă de experți instruiți pentru a analiza aceste raportări.
ChatGPT: Dacă cineva distribuie o conversație despre care credeți că include conținut problematic, o puteți și raporta către noi.
SORA: Dacă vedeți în fluxul dvs. un videoclip sau o imagine despre care credeți că include conținut problematic, le puteți raporta către noi.
Pentru mai multe detalii despre cum să raportați conținut direct în ChatGPT sau SORA, consultați acest articol.
GPTs
Folosim de asemenea instrumente automate, precum API-ul nostru /moderation, pentru a vedea dacă un GPT este potențial problematic. Dacă detectăm conținut problematic asociat cu GPT-ul, vom lua măsuri, cum ar fi împiedicarea distribuirii acestuia. Creatorul poate edita configurația GPT-ului sau a API-ului pentru a elimina conținutul problematic sau poate contesta decizia printr-un flux din produs. Într-un set foarte limitat de circumstanțe, putem de asemenea să suspendăm contul creatorului pentru comportament grav.
Acceptăm și raportări umane privind GPT-uri problematice. Dacă vedeți un GPT despre care credeți că încalcă politicile noastre de utilizare sau reflectă în alt mod conținut problematic, îl puteți și raporta către noi. Folosim o combinație de sisteme automate și o echipă de experți instruiți pentru a analiza aceste raportări.
