Vi tror på ansvarlig, iterativ utvikling og utrulling som et middel for å oppnå trygg kunstig generell intelligens. Vi utfører en betydelig mengde testing og risikoreduserende tiltak knyttet til sikkerhet og tilpasning før vi lanserer en modell for offentligheten, og vi har også automatiserte og menneskelige systemer på plass for å bidra til å oppdage problematisk innhold som vises i tjenestene våre for enkeltpersoner, som ChatGPT og GPT-er. Vi beskriver noen av disse tiltakene nedenfor.

ChatGPT og ImageGen

Vi bruker automatiserte verktøy, for eksempel en intern versjon av vårt /moderations API, til å oppdage innhold (prompter, fullføringer, opplastinger) som kan være skadelig eller bryte med retningslinjene våre for bruk. Hvis vi oppdager problematisk innhold, vil vi vanligvis enten advare deg om at innholdet ditt kan bryte med retningslinjene våre for bruk, eller blokkere modellen fra å svare på prompten din. Vi kan også forhindre at chatten med den problematiske prompten eller fullføringen deles. I et svært begrenset antall tilfeller kan vi også utestenge kontoen din ved særlig grov atferd.

Vi godtar også rapporter fra mennesker om problematisk innhold på ChatGPT. Vi bruker en kombinasjon av automatiserte systemer og et opplært team av eksperter til å gjennomgå disse rapportene.

ChatGPT: Hvis noen deler en chat som du mener inneholder problematisk innhold, kan du også rapportere den til oss.

Hvis du vil ha mer informasjon om hvordan du rapporterer innhold direkte i ChatGPT, kan du se denne artikkelen.

GPT-er

Vi bruker også automatiserte verktøy som vårt /moderation API for å se om en GPT kan være problematisk. Hvis vi oppdager problematisk innhold knyttet til GPT-en, iverksetter vi tiltak, for eksempel å hindre at den distribueres. Utvikleren kan redigere konfigurasjonen av GPT-en eller API-et for å fjerne det problematiske innholdet, eller kan anke avgjørelsen via en flyt i produktet. I et svært begrenset antall tilfeller kan vi også utestenge utviklerens konto ved særlig grov atferd.

Vi godtar også rapporter fra mennesker om problematiske GPT-er. Hvis du ser en GPT som du mener bryter med retningslinjene våre for bruk eller på annen måte gjenspeiler problematisk innhold, kan du også rapportere den til oss. Vi bruker en kombinasjon av automatiserte systemer og et opplært team av eksperter til å gjennomgå disse rapportene.

Hvordan vi identifiserer problematisk innhold på tjenestene våre for enkeltpersoner

ChatGPT og ImageGen

GPT-er

Var denne artikkelen nyttig?