OpenAI
Esta página foi traduzida automaticamente. Ver o artigo original em inglês.

Como identificamos conteúdo problemático nos nossos serviços para indivíduos

Atualizado: 24 hours ago

Acreditamos no desenvolvimento e na implementação responsáveis e iterativos como forma de alcançar uma inteligência artificial geral segura. Realizamos uma quantidade considerável de testes e mitigação de segurança e alinhamento antes de lançar qualquer modelo ao público, e também temos sistemas automatizados e humanos para ajudar a detetar conteúdo problemático que aparece nos nossos serviços para utilizadores individuais, como o ChatGPT e os GPTs. Descrevemos alguns desses esforços abaixo.

ChatGPT e ImageGen

Utilizamos ferramentas automatizadas, como uma versão interna da nossa API /moderations, para detetar conteúdo (prompts, respostas, carregamentos) que possa ser prejudicial ou violar as nossas Políticas de Utilização. Se detetarmos conteúdo problemático, normalmente apresentamos um aviso de que o seu conteúdo pode violar as nossas políticas de utilização ou impedimos que o modelo responda ao seu prompt. Também podemos impedir a partilha da conversa com o prompt ou a resposta problemáticos. Num conjunto muito limitado de circunstâncias, também podemos banir a sua conta por comportamento grave.

Também aceitamos denúncias feitas por pessoas sobre conteúdo problemático no ChatGPT. Utilizamos uma combinação de sistemas automatizados e uma equipa de especialistas com formação para analisar estas denúncias.

Para obter mais detalhes sobre como denunciar conteúdo diretamente no ChatGPT, consulte este artigo.

GPTs

Também utilizamos ferramentas automatizadas, como a nossa API /moderation, para verificar se um GPT é potencialmente problemático. Se detetarmos conteúdo problemático associado ao GPT, tomaremos medidas, como impedir a sua distribuição. O criador pode editar a configuração do GPT ou da API para remover o conteúdo problemático, ou pode recorrer da decisão através de um fluxo no produto. Num conjunto muito limitado de circunstâncias, também podemos banir a conta do criador por comportamento grave.

Também aceitamos denúncias feitas por pessoas sobre GPTs problemáticos. Se vir um GPT que considera violar as nossas políticas de utilização ou refletir, de outro modo, conteúdo problemático, também pode denunciá-lo junto de nós. Utilizamos uma combinação de sistemas automatizados e uma equipa de especialistas com formação para analisar estas denúncias.

Este artigo foi útil?