Crediamo nello sviluppo e nella distribuzione responsabili e iterativi come percorso verso un’intelligenza artificiale generale sicura. Effettuiamo numerosi test di sicurezza e allineamento e attività di mitigazione prima di rendere un modello disponibile al pubblico e disponiamo inoltre di sistemi automatizzati e umani per rilevare contenuti problematici che possono comparire nei nostri servizi per utenti, tra cui ChatGPT e i GPT. Di seguito illustriamo alcune di queste iniziative.

ChatGPT e ImageGen

Utilizziamo strumenti automatizzati, come una versione interna della nostra API di moderazione, per rilevare contenuti (prompt, completamenti, caricamenti) che potrebbero essere dannosi o violare le nostre Politiche di utilizzo. Se rileviamo contenuti problematici, di norma ti avviseremo che il tuo contenuto potrebbe violare le nostre politiche di utilizzo, oppure impediremo al modello dal rispondere al tuo prompt. Potremmo anche impedire la condivisione della chat contenente il prompt o il completamento problematico. In un numero molto limitato di circostanze, potremmo anche sospendere il tuo account in caso di comportamenti gravi.

Accettiamo anche segnalazioni da parte di utenti umani relative a contenuti problematici su ChatGPT. Utilizziamo una combinazione di sistemi automatizzati e un team di esperti qualificati per prendere in esame queste segnalazioni.

ChatGPT: se qualcuno condivide una chat che ritieni contenga contenuti problematici, puoi anche segnalarcela.

Per maggiori dettagli su come segnalare contenuti direttamente in ChatGPT, consulta questo articolo.

GPT

Utilizziamo anche strumenti automatizzati, come la nostra API di moderazione, per verificare se un GPT è potenzialmente problematico. Interveniamo se rileviamo contenuti problematici associati al GPT, ad esempio impedendone la distribuzione. Il creatore può modificare la configurazione del GPT o dell’API per rimuovere i contenuti problematici oppure può presentare ricorso contro la decisione tramite un flusso integrato nel prodotto. In un numero molto limitato di circostanze, potremmo anche sospendere l’account del creatore in caso di comportamenti gravi..

Accettiamo anche segnalazioni umane di GPT problematici. Se vedi un GPT che ritieni violi le nostre politiche di utilizzo o con contenuti problematici, puoi anche segnalarcelo. Utilizziamo una combinazione di sistemi automatizzati e un team di esperti qualificati per prendere in esame queste segnalazioni.

Come identifichiamo i contenuti problematici sui nostri servizi per singoli utenti

ChatGPT e ImageGen

GPT

Questo articolo è stato utile?