OpenAI
Tato stránka byla přeložena strojově. Zobrazit původní článek v angličtině.

Jak identifikujeme problematický obsah v našich službách pro jednotlivce

Aktualizováno: 14 days ago

Věříme v odpovědný, iterativní vývoj a nasazování jako prostředek k dosažení bezpečné obecné umělé inteligence. Než model zpřístupníme veřejnosti, provádíme značné množství bezpečnostního a alignment testování a zmírňování rizik, a máme také zavedené automatizované i lidské systémy, které pomáhají odhalovat problematický obsah objevující se v našich službách pro jednotlivce, jako jsou ChatGPT a GPTs. Níže uvádíme některé z těchto opatření.

ChatGPT, ImageGen a SORA

K odhalování obsahu (promptů, dokončení, nahraných souborů), který může být škodlivý nebo porušovat naše Zásady používání, používáme automatizované nástroje, například interní verzi našeho /moderations API. Pokud odhalíme problematický obsah, obvykle vás buď upozorníme, že váš obsah může porušovat naše zásady používání, nebo modelu zablokujeme odpověď na váš prompt. Můžeme také zabránit sdílení chatu s problematickým promptem nebo dokončením. Ve velmi omezeném okruhu případů můžeme váš účet za závažné porušení pravidel také zablokovat.

Přijímáme také hlášení problematického obsahu v ChatGPT a SORA od lidí. K přezkumu těchto hlášení používáme kombinaci automatizovaných systémů a vyškoleného týmu odborníků.

  • ChatGPT: Pokud někdo sdílí chat, o kterém se domníváte, že obsahuje problematický obsah, můžete nám jej také nahlásit.

  • SORA: Pokud ve svém feedu uvidíte video nebo obrázek, o kterém se domníváte, že obsahuje problematický obsah, můžete nám jej nahlásit.

Další podrobnosti o tom, jak nahlásit obsah přímo v ChatGPT nebo SORA, najdete v tomto článku.

GPTs

Používáme také automatizované nástroje, jako je naše /moderation API, abychom zjistili, zda je GPT potenciálně problematický. Pokud odhalíme problematický obsah spojený s GPT, podnikneme kroky, například zabráníme jeho distribuci. Tvůrce může upravit konfiguraci GPT nebo API tak, aby problematický obsah odstranil, nebo se proti rozhodnutí odvolat prostřednictvím postupu v produktu. Ve velmi omezeném okruhu případů můžeme účet tvůrce za závažné porušení pravidel také zablokovat.

Přijímáme také hlášení problematických GPT od lidí. Pokud uvidíte GPT, o kterém se domníváte, že porušuje naše zásady používání nebo jinak představuje problematický obsah, můžete nám jej také nahlásit. K přezkumu těchto hlášení používáme kombinaci automatizovaných systémů a vyškoleného týmu odborníků.

Byl tento článek užitečný?