Wij geloven in verantwoorde, iteratieve ontwikkeling en implementatie als middel om veilige kunstmatige algemene intelligentie te bereiken. We voeren veel tests en mitigatie op het gebied van veiligheid en afstemming uit voordat we ooit een model voor het publiek lanceren, en we hebben ook geautomatiseerde en menselijke systemen om problematische content te helpen detecteren die verschijnt op onze diensten voor particulieren, zoals ChatGPT en GPT's. Hieronder beschrijven we enkele van die inspanningen.

ChatGPT en ImageGen

We gebruiken geautomatiseerde tools, zoals een interne versie van onze /moderations API, om content te detecteren (prompts, voltooiingen, uploads) die schadelijk kan zijn of ons gebruiksbeleid kan schenden. Als we problematische content detecteren, waarschuwen we je doorgaans dat je content mogelijk ons gebruiksbeleid schendt, of blokkeren we het model zodat het niet op je prompt reageert. We kunnen ook voorkomen dat de chat met de problematische prompt of voltooiing wordt gedeeld. In een zeer beperkt aantal gevallen kunnen we je account ook blokkeren wegens ernstig wangedrag.

We accepteren ook meldingen van mensen over problematische content op ChatGPT. We gebruiken een combinatie van geautomatiseerde systemen en een getraind team van experts om deze meldingen te beoordelen.

ChatGPT: Als iemand een chat deelt waarvan je denkt dat deze problematische content bevat, kun je die ook aan ons melden.

Zie dit artikel voor meer informatie over hoe je content rechtstreeks in ChatGPT kunt melden.

GPT's

We gebruiken ook geautomatiseerde tools, zoals onze /moderation API, om te zien of een GPT mogelijk problematisch is. Als we problematische content detecteren die aan de GPT is gekoppeld, ondernemen we actie, bijvoorbeeld door te voorkomen dat deze wordt verspreid. De bouwer kan de configuratie van de GPT of API bewerken om de problematische content te verwijderen, of kan via een flow in het product bezwaar maken tegen de beslissing. In een zeer beperkt aantal gevallen kunnen we het account van de bouwer ook blokkeren wegens ernstig wangedrag.

We accepteren ook meldingen van mensen over problematische GPT's. Als je een GPT ziet waarvan je denkt dat deze ons gebruiksbeleid schendt of anderszins problematische content weergeeft, kun je die ook aan ons melden. We gebruiken een combinatie van geautomatiseerde systemen en een getraind team van experts om deze meldingen te beoordelen.

Hoe we problematische content op onze diensten voor individuen identificeren

ChatGPT en ImageGen

GPT's

Was dit artikel nuttig?