Vjerujemo u odgovoran, iterativan razvoj i uvođenje kao put prema postizanju sigurne opće umjetne inteligencije. Prije nego što model uopće učinimo javno dostupnim, provodimo opsežna testiranja sigurnosti i usklađivanja te ublažavanja, a imamo i automatizirane i ljudske sustave koji pomažu otkriti problematičan sadržaj koji se pojavljuje na našim uslugama za pojedince, kao što su ChatGPT i GPT-ovi. U nastavku opisujemo neka od tih nastojanja.
ChatGPT i ImageGen
Koristimo automatizirane alate, kao što je interna verzija našeg /moderations API, za otkrivanje sadržaja (upita, dovršetaka, učitavanja) koji može biti štetan ili kršiti naša Pravila upotrebe. Ako otkrijemo problematičan sadržaj, obično ćemo vas upozoriti da vaš sadržaj možda krši naša pravila upotrebe ili ćemo spriječiti model da odgovori na vaš upit. Možemo i spriječiti dijeljenje razgovora s problematičnim upitom ili dovršetkom. U vrlo ograničenom broju okolnosti možemo i blokirati vaš račun zbog osobito teškog ponašanja.
Zaprimamo i prijave problematičnog sadržaja na ChatGPT-u koje podnose ljudi. Za pregled tih prijava koristimo kombinaciju automatiziranih sustava i obučenog tima stručnjaka.
ChatGPT: Ako netko podijeli razgovor za koji smatrate da sadrži problematičan sadržaj, možete ga i prijaviti nama.
Više pojedinosti o tome kako izravno prijaviti sadržaj u ChatGPT-u potražite u ovom članku.
GPT-ovi
Koristimo i automatizirane alate, kao što je naš /moderation API, kako bismo provjerili je li GPT potencijalno problematičan. Ako otkrijemo problematičan sadržaj povezan s GPT-om, poduzet ćemo mjere, primjerice spriječiti njegovu distribuciju. Izrađivač može urediti konfiguraciju GPT-a ili API-ja kako bi uklonio problematičan sadržaj ili može uložiti žalbu na odluku putem postupka unutar proizvoda. U vrlo ograničenom broju okolnosti možemo i blokirati račun izrađivača zbog osobito teškog ponašanja.
Zaprimamo i prijave problematičnih GPT-ova koje podnose ljudi. Ako vidite GPT za koji smatrate da krši naša pravila upotrebe ili na drugi način odražava problematičan sadržaj, možete ga i prijaviti nama. Za pregled tih prijava koristimo kombinaciju automatiziranih sustava i obučenog tima stručnjaka.
