Crediamo nello sviluppo e nel rilascio responsabili e iterativi come mezzo per raggiungere un’intelligenza artificiale generale sicura. Svolgiamo un notevole lavoro di test e mitigazione in ambito sicurezza e allineamento prima ancora di lanciare un modello al pubblico, e disponiamo anche di sistemi automatizzati e umani per aiutare a rilevare contenuti problematici che compaiono sui nostri servizi per gli individui, come ChatGPT e GPT. Di seguito descriviamo alcune di queste iniziative.
ChatGPT, ImageGen e SORA
Utilizziamo strumenti automatizzati, come una versione interna della nostra API /moderations, per rilevare contenuti (prompt, completions, caricamenti) che potrebbero essere dannosi o violare le nostre Norme di utilizzo. Se rileviamo contenuti problematici, in genere ti avviseremo che i tuoi contenuti potrebbero violare le nostre norme di utilizzo oppure impediremo al modello di rispondere al tuo prompt. Potremmo anche impedire che la chat con il prompt o la completion problematici venga condivisa. In un numero molto limitato di circostanze, potremmo anche sospendere il tuo account in caso di comportamenti gravi.
Accettiamo anche segnalazioni umane di contenuti problematici su ChatGPT e SORA. Usiamo una combinazione di sistemi automatizzati e un team di esperti qualificati per esaminare queste segnalazioni.
ChatGPT: Se qualcuno condivide una chat che ritieni contenga contenuti problematici, puoi anche segnalarcela.
SORA: Se vedi un video o un’immagine nel tuo feed che ritieni contenga contenuti problematici, puoi segnalarcela.
Per maggiori dettagli su come segnalare contenuti direttamente in ChatGPT o SORA, consulta questo articolo.
GPT
Utilizziamo anche strumenti automatizzati, come la nostra API /moderation, per verificare se un GPT è potenzialmente problematico. Se rileviamo contenuti problematici associati al GPT, interverremo, ad esempio impedendone la distribuzione. Il creatore può modificare la configurazione del GPT o dell’API per rimuovere i contenuti problematici oppure presentare ricorso tramite un flusso all’interno del prodotto. In un numero molto limitato di circostanze, potremmo anche sospendere l’account del creatore in caso di comportamenti gravi.
Accettiamo anche segnalazioni umane di GPT problematici. Se vedi un GPT che ritieni stia violando le nostre norme di utilizzo o che in altro modo presenti contenuti problematici, puoi anche segnalarcelo. Usiamo una combinazione di sistemi automatizzati e un team di esperti qualificati per esaminare queste segnalazioni.
