Wij geloven in verantwoorde, iteratieve ontwikkeling en implementatie als middel om veilige kunstmatige algemene intelligentie te bereiken. We doen een aanzienlijke hoeveelheid veiligheids- en alignment-tests en mitigatie voordat we ooit een model voor het publiek lanceren, en we hebben ook geautomatiseerde en menselijke systemen om problematische content te helpen detecteren die verschijnt op onze diensten voor individuen, zoals ChatGPT en GPTs. Hieronder lichten we enkele van die inspanningen toe.
ChatGPT, ImageGen en SORA
We gebruiken geautomatiseerde tools, zoals een interne versie van onze /moderations API, om content (prompts, completions, uploads) te detecteren die schadelijk kan zijn of in strijd kan zijn met ons gebruiksbeleid. Als we problematische content detecteren, waarschuwen we je doorgaans dat je content mogelijk in strijd is met ons gebruiksbeleid of blokkeren we het model om op je prompt te reageren. We kunnen ook voorkomen dat de chat met de problematische prompt of completion wordt gedeeld. In een zeer beperkt aantal omstandigheden kunnen we je account ook verbannen wegens ernstig wangedrag.
We accepteren ook meldingen van mensen over problematische content op ChatGPT en SORA. We gebruiken een combinatie van geautomatiseerde systemen en een getraind team van experts om deze meldingen te beoordelen.
ChatGPT: Als iemand een chat deelt waarvan jij denkt dat deze problematische content bevat, kun je die ook bij ons melden.
SORA: Als je een video of afbeelding in je feed ziet waarvan jij denkt dat deze problematische content bevat, kun je die bij ons melden.
Zie dit artikel voor meer informatie over hoe je content rechtstreeks in ChatGPT of SORA kunt melden.
GPTs
We gebruiken ook geautomatiseerde tools zoals onze /moderation API om te zien of een GPT mogelijk problematisch is. Als we problematische content detecteren die met de GPT samenhangt, ondernemen we actie, zoals voorkomen dat deze wordt verspreid. De bouwer kan de configuratie van de GPT of API bewerken om de problematische content te verwijderen of kan via een flow in het product bezwaar maken tegen de beslissing. In een zeer beperkt aantal omstandigheden kunnen we het account van de bouwer ook verbannen wegens ernstig wangedrag.
We accepteren ook meldingen van mensen over problematische GPTs. Als je een GPT ziet waarvan jij denkt dat die in strijd is met ons gebruiksbeleid of anderszins problematische content weerspiegelt, kun je die ook bij ons melden. We gebruiken een combinatie van geautomatiseerde systemen en een getraind team van experts om deze meldingen te beoordelen.
