OpenAI
Denne siden ble maskinoversatt. Se den opprinnelige engelske artikkelen.

Hvordan vi identifiserer problematisk innhold på tjenestene våre for enkeltpersoner

Oppdatert: 14 days ago

Vi tror på ansvarlig, iterativ utvikling og utrulling som en måte å oppnå trygg kunstig generell intelligens på. Vi gjennomfører omfattende testing og risikoreduserende tiltak knyttet til sikkerhet og samkjøring før vi i det hele tatt lanserer en modell offentlig, og vi har også automatiserte og menneskelige systemer på plass for å bidra til å oppdage problematisk innhold som vises på tjenestene våre for enkeltpersoner, som ChatGPT og GPT-er. Nedenfor beskriver vi noen av disse tiltakene.

ChatGPT, ImageGen og SORA

Vi bruker automatiserte verktøy, som en intern versjon av vår /moderations API, for å oppdage innhold (prompter, fullføringer, opplastinger) som kan være skadelig eller bryte med retningslinjene våre for bruk. Hvis vi oppdager problematisk innhold, vil vi vanligvis enten advare deg om at innholdet ditt kan bryte med retningslinjene våre for bruk eller blokkere modellen fra å svare på prompten din. Vi kan også hindre at chatten med den problematiske prompten eller fullføringen deles. I et svært begrenset antall tilfeller kan vi også utestenge kontoen din ved særlig grove overtredelser.

Vi mottar også rapporter fra mennesker om problematisk innhold på ChatGPT og SORA. Vi bruker en kombinasjon av automatiserte systemer og et opplært ekspertteam til å gjennomgå disse rapportene.

  • ChatGPT: Hvis noen deler en chat som du mener inneholder problematisk innhold, kan du også rapportere det til oss.

  • SORA: Hvis du ser en video eller et bilde i feeden din som du mener inneholder problematisk innhold, kan du rapportere det til oss.

Hvis du vil ha mer informasjon om hvordan du rapporterer innhold direkte i ChatGPT eller SORA, kan du se denne artikkelen.

GPT-er

Vi bruker også automatiserte verktøy, som vår /moderation API, for å se om en GPT potensielt er problematisk. Hvis vi oppdager problematisk innhold knyttet til GPT-en, vil vi iverksette tiltak, for eksempel hindre at den distribueres. Byggeren kan redigere konfigurasjonen til GPT-en eller API-et for å fjerne det problematiske innholdet, eller anke avgjørelsen via en flyt i produktet. I et svært begrenset antall tilfeller kan vi også utestenge byggerens konto ved særlig grove overtredelser.

Vi mottar også rapporter fra mennesker om problematiske GPT-er. Hvis du ser en GPT som du mener bryter med retningslinjene våre for bruk eller på annen måte gjenspeiler problematisk innhold, kan du også rapportere det til oss. Vi bruker en kombinasjon av automatiserte systemer og et opplært ekspertteam til å gjennomgå disse rapportene.

Var denne artikkelen nyttig?