Věříme v odpovědný, iterativní vývoj a nasazování jako prostředek k dosažení bezpečné obecné umělé inteligence. Než model zpřístupníme veřejnosti, provádíme značné množství bezpečnostního a alignment testování a zmírňování rizik, a máme také zavedené automatizované i lidské systémy, které pomáhají odhalovat problematický obsah objevující se v našich službách pro jednotlivce, jako jsou ChatGPT a GPTs. Níže uvádíme některé z těchto opatření.
ChatGPT, ImageGen a SORA
K odhalování obsahu (promptů, dokončení, nahraných souborů), který může být škodlivý nebo porušovat naše Zásady používání, používáme automatizované nástroje, například interní verzi našeho /moderations API. Pokud odhalíme problematický obsah, obvykle vás buď upozorníme, že váš obsah může porušovat naše zásady používání, nebo modelu zablokujeme odpověď na váš prompt. Můžeme také zabránit sdílení chatu s problematickým promptem nebo dokončením. Ve velmi omezeném okruhu případů můžeme váš účet za závažné porušení pravidel také zablokovat.
Přijímáme také hlášení problematického obsahu v ChatGPT a SORA od lidí. K přezkumu těchto hlášení používáme kombinaci automatizovaných systémů a vyškoleného týmu odborníků.
ChatGPT: Pokud někdo sdílí chat, o kterém se domníváte, že obsahuje problematický obsah, můžete nám jej také nahlásit.
SORA: Pokud ve svém feedu uvidíte video nebo obrázek, o kterém se domníváte, že obsahuje problematický obsah, můžete nám jej nahlásit.
Další podrobnosti o tom, jak nahlásit obsah přímo v ChatGPT nebo SORA, najdete v tomto článku.
GPTs
Používáme také automatizované nástroje, jako je naše /moderation API, abychom zjistili, zda je GPT potenciálně problematický. Pokud odhalíme problematický obsah spojený s GPT, podnikneme kroky, například zabráníme jeho distribuci. Tvůrce může upravit konfiguraci GPT nebo API tak, aby problematický obsah odstranil, nebo se proti rozhodnutí odvolat prostřednictvím postupu v produktu. Ve velmi omezeném okruhu případů můžeme účet tvůrce za závažné porušení pravidel také zablokovat.
Přijímáme také hlášení problematických GPT od lidí. Pokud uvidíte GPT, o kterém se domníváte, že porušuje naše zásady používání nebo jinak představuje problematický obsah, můžete nám jej také nahlásit. K přezkumu těchto hlášení používáme kombinaci automatizovaných systémů a vyškoleného týmu odborníků.
