Saiba mais sobre como desenvolvemos nossos modelos e os aplicamos em produtos como o ChatGPT

Os modelos fundamentais da OpenAI, incluindo os modelos que alimentam o ChatGPT, são desenvolvidos usando três fontes principais de informação: (1) informações disponíveis publicamente na internet, (2) informações que obtemos por meio de parcerias com terceiros e (3) informações que nossos usuários, treinadores humanos e pesquisadores fornecem ou geram.

O desenvolvimento de modelos de base, como os usados no ChatGPT, envolve várias etapas, incluindo preparação de dados de treinamento, pré-treinamento e pós-treinamento, bem como avaliação e aprimoramento contínuos após a implantação. Diferentes tipos de informação podem ser usados nessas etapas para diversos fins, inclusive melhorar o desempenho, a confiabilidade e a segurança do modelo.

Este artigo mostra uma visão geral das informações que utilizamos para ajudar a desenvolver esses modelos, como coletamos e usamos essas informações em conformidade com as leis de privacidade e as medidas de proteção que aplicamos durante todo o processo de treinamento. Para entender como coletamos e usamos informações dos usuários de nossos serviços, incluindo como não autorizar o uso de suas conversas do ChatGPT para melhorar nossos modelos, consulte nossa Política de Privacidade e este artigo da Central de Ajuda.

O que é o ChatGPT e como ele funciona?

O ChatGPT é um serviço baseado em inteligência artificial que você pode acessar pela internet ou pelo aplicativo. Você pode usar o ChatGPT para uma variedade de tarefas, como organizar e resumir informações, auxiliar em traduções, ajudar a programar, pesquisar e analisar, realizar tarefas com várias etapas em diferentes ferramentas, analisar ou gerar imagens, inspirar criatividade e ideias, e outras atividades do dia a dia. O ChatGPT foi projetado para entender e responder às perguntas e instruções do usuário, aprendendo padrões a partir de grandes volumes de informação, incluindo texto, imagens, áudio e vídeo.

Durante o treinamento, o modelo analisa as relações dentro desses dados (por exemplo, como as palavras normalmente aparecem juntas em contexto) e usa esse conhecimento para prever a próxima palavra mais provável ao gerar uma resposta, uma palavra de cada vez. O texto pode ser convertido em unidades menores, às vezes chamadas de “tokens”, que podem representar palavras inteiras, partes de palavras ou pontuação. Os tokens são os elementos básicos do texto que o modelo processa. Da mesma forma, os modelos que geram outros tipos de conteúdo, como imagens, aprendem padrões de como os pixels se relacionam entre si e com as legendas associadas nos dados de treinamento.

Por exemplo, durante o processo de aprendizado do modelo (conhecido como “treinamento”), o modelo pode ser encarregado de completar uma frase como: “Em vez de virar à esquerda, ela virou ___.” No início do treinamento, as respostas são em grande parte aleatórias. No entanto, à medida que o modelo processa e aprende com um grande volume de texto, ele se torna mais eficiente em reconhecer padrões e prever a palavra seguinte mais provável. Esse processo é repetido em milhões de frases para refinar a compreensão e melhorar a precisão.

Como há várias maneiras plausíveis de completar uma frase — como “Em vez de virar à esquerda, ela virou à direita”, “ao redor” ou “para trás” — existe um elemento inerente de aleatoriedade na forma como o modelo responde. Como resultado, a mesma pergunta pode gerar respostas diferentes em consultas distintas.

Os modelos de aprendizado de máquina consistem em grandes conjuntos de números, conhecidos como “pesos” ou “parâmetros”, juntamente com o código que interpreta e utiliza esses números. Esses modelos não armazenam nem retêm cópias dos dados em que são treinados. Em vez disso, conforme um modelo aprende, os valores de seus parâmetros são ajustados levemente para refletir os padrões que ele identificou. No exemplo anterior, o modelo melhorou de prever palavras aleatórias para fazer previsões mais precisas—não por armazenar as frases de treinamento, mas por atualizar seus parâmetros internos. O modelo não retém cópias das frases, imagens ou áudio que processa durante o treinamento. O ChatGPT não “copia e cola” de seus dados de treinamento — assim como um professor, após um estudo extenso, pode explicar conceitos entendendo as relações entre ideias sem memorizar ou reproduzir os materiais originais ao pé da letra. Ao gerar uma resposta a uma solicitação do usuário, o modelo utiliza esses pesos aprendidos para prever e gerar novo conteúdo.

Que tipo de informação é usada para ensinar o ChatGPT?

Para conteúdo disponível publicamente na internet, utilizamos apenas informações que são de acesso livre e aberto na internet. Isso pode incluir páginas da web, fóruns, blogs, publicações e outros conteúdos online disponíveis ao público. Por exemplo, se você participar de um fórum de discussão online público ou tiver um blog ou outra postagem pública, poderemos usar esse conteúdo aberto para o treinamento dos modelos. No entanto, tomamos medidas para reduzir o processamento de informações pessoais em nosso método de treinamento. Ao coletar conteúdo disponível publicamente na internet, não coletamos de forma intencional dados de fontes conhecidas por estarem protegidas por paywall ou localizadas na dark web. Além disso, aplicamos filtros para remover material do qual não queremos que nossos modelos aprendam, como discurso de ódio, conteúdo adulto, sites que agregam informações pessoais e spam. As informações restantes são então usadas para treinar nossos modelos.

Proprietários de sites podem gerenciar se o conteúdo disponível publicamente em seus sites pode ser acessado para uso no treinamento por meio de controles padrão da web, como o arquivo robots.txt, para bloquear o GPTBot, que pode rastrear esse conteúdo para ajudar a treinar nossos modelos. Fornecemos orientações para ajudar proprietários de sites a gerenciar a interação de sites e conteúdo com nossos sistemas de IA.

Também usamos informações de parceiros externos para ajudar a treinar e melhorar nossos modelos. Isso pode incluir informações em conjuntos de dados que acessamos por meio de acordos com terceiros, bem como informações fornecidas ou geradas por treinadores humanos e pesquisadores quando permitido por nossas políticas e contratos. Essa abordagem ajuda a melhorar a qualidade, a segurança e o desempenho dos nossos modelos. As fontes podem incluir texto, imagens, áudio, vídeo ou outros tipos de dados, dependendo do conjunto de dados.

Além disso, usamos cada vez mais dados sintéticos em alguns processos de treinamento. Por exemplo, podemos usar informações e nossos modelos para gerar prompt sintéticos, exemplos em diferentes idiomas ou outros materiais de treinamento. Dados sintéticos podem ajudar a melhorar o desempenho de modelos, inclusive ao complementar dados de treinamento em áreas em que os dados são escassos ou desbalanceados, e apoiar abordagens de desenvolvimento de modelos que reforçam a privacidade.

As informações pessoais são usadas para ensinar o ChatGPT?

Como uma parte significativa do conteúdo online envolve informações sobre pessoas, nossos dados de treinamento podem incluir, incidentalmente, informações pessoais. No entanto, tomamos medidas para reduzir o processamento de informações pessoais em nosso método de treinamento.

Usamos dados de treinamento para desenvolver as capacidades do modelo, como previsão, raciocínio e resolução de problemas, e não para criar perfis de pessoas, contatá-las ou personalizar anúncios para elas.

Em alguns casos, os modelos podem aprender a partir de informações pessoais para entender como elementos como nomes e endereços funcionam na linguagem, ou para reconhecer figuras públicas e entidades conhecidas. Isso ajuda o modelo a gerar respostas mais precisas e adequadas ao contexto.

Como as informações pessoais são protegidas durante o treinamento?

Tomamos medidas ativas para limitar o processamento de informações pessoais durante o treinamento. Por exemplo, excluímos fontes conhecidas que agregam grandes volumes de dados pessoais, aplicamos filtros para reduzir informações pessoais no processo de treinamento e tomamos medidas para identificar e remover conteúdo duplicado a fim de reduzir o risco de repetir dados de treinamento. Além disso, treinamos nossos modelos para evitar responder a solicitações de informações privadas ou delicadas sobre indivíduos.

Por quanto tempo retemos informações

Retemos informações em dados de treinamento apenas pelo tempo razoavelmente necessário para as finalidades descritas neste artigo e em nossa Política de Privacidade, inclusive para desenvolver e aprimorar nossos modelos e para fins relacionados de pesquisa científica. A retenção está sujeita a revisões periódicas para garantir sua necessidade contínua e varia conforme o tipo de informação e sua forma de uso. Para determinar o período de retenção, consideramos fatores como nossa finalidade para processar as informações, a quantidade, a natureza e a sensibilidade das informações, o risco potencial de danos decorrentes do uso ou da divulgação não autorizados e quaisquer obrigações legais às quais estamos sujeitos.

Como o desenvolvimento do ChatGPT cumpre as leis de privacidade?

Usamos informações de treinamento de forma lícita. Nossos modelos de base possibilitam uma ampla gama de aplicações benéficas, incluindo ferramentas de acessibilidade, suporte ao cliente, desenvolvimento de software, ensino personalizado e pesquisa científica. Essas capacidades dependem de dados de treinamento em grande escala, como informações disponíveis publicamente e de parceiros externos. Aplicamos medidas de segurança durante todo o processo de treinamento, inclusive etapas criadas para reduzir o tratamento de informações pessoais e mitigar riscos, conforme descrito neste artigo. Nossa coleta e nosso uso de informações pessoais incluídas em informações de treinamento se baseiam em interesses legítimos, conforme previsto em leis de privacidade como o GDPR, inclusive para treinar e aprimorar nossos modelos para usuários e para a sociedade em geral, de acordo com nossa missão de garantir que a inteligência artificial geral seja benéfica para todos, como explicado em mais detalhes em nossa Política de Privacidade. Realizamos uma avaliação de impacto sobre a proteção de dados para garantir que estamos coletando e usando essas informações de forma legal e responsável.

Quando as informações podem ser compartilhadas ou transferidas

Não “vendemos” informações pessoais, e somente as disponibilizamos nos dados de treinamento nas circunstâncias limitadas descritas em nossa Política de Privacidade. Por exemplo, podemos compartilhar informações com afiliados, fornecedores e prestadores de serviços que dão suporte ao desenvolvimento, teste e aprimoramento dos nossos modelos. Também podemos divulgar informações se acreditarmos, de boa-fé, que tal ação é necessária para cumprir uma obrigação legal ou proteger nossos direitos e segurança, bem como os de nossos usuários, funcionários ou do público, conforme descrito em nossa Política de Privacidade.

Como nossa infraestrutura é global, as informações pessoais nos dados de treinamento podem ser processadas em países fora do Espaço Econômico Europeu, da Suíça ou do Reino Unido (inclusive nos Estados Unidos). Quando isso ocorre, aplicamos proteções apropriadas, como decisões de adequabilidade ou cláusulas contratuais padrão, conforme descrito em nossa Política de Privacidade.

Seus direitos e como exercê-los

Respondemos a pedidos de objeção e direitos semelhantes. Como resultado do aprendizado de linguagem, as respostas do ChatGPT podem, às vezes, incluir informações pessoais sobre indivíduos cujas informações pessoais aparecem várias vezes na internet pública (por exemplo, figuras públicas). Em determinadas jurisdições, os indivíduos podem opor-se ao processamento de suas informações pessoais pelos nossos modelos ou fazer outros pedidos relativos aos seus direitos como titulares de dados por meio do nosso Portal de Privacidade. Você também pode exercer esses direitos entrando em contato com privacy@openai.com.

Para nos ajudar a avaliar e responder ao seu pedido, forneça informações suficientes, como seu nome, URLs relevantes, exemplos específicos de resultados do modelo ou outros detalhes que ajudem a identificar o problema, para que possamos entender a quais informações pessoais você se refere. Em alguns casos, podemos solicitar que você valide sua identidade ou confirme que as informações dizem respeito a você antes que possamos tomar qualquer providência. Mais informações sobre como enviar esses pedidos, incluindo práticas recomendadas e como os pedidos são analisados, estão disponíveis em nosso artigo da Central de Ajuda sobre a remoção de dados pessoais do ChatGPT. Analisamos os pedidos em conformidade com as leis de privacidade vigentes e respondemos dentro dos prazos legais aplicáveis.

Esteja ciente de que, em conformidade com as leis de privacidade, alguns direitos podem não ser absolutos. Por exemplo, talvez não seja possível atender a um pedido quando não pudermos verificar as informações relevantes, quando o pedido não estiver relacionado a informações pessoais processadas pela OpenAI, quando uma exceção for aplicada ou quando tivermos outro motivo legal para fazer isso. Os pedidos são avaliados caso a caso e podem envolver conciliar direitos de privacidade e outras considerações importantes, como liberdade de expressão e interesse público.

No entanto, nos esforçamos para priorizar a proteção das informações pessoais e cumprir todas as leis de privacidade aplicáveis. Se você achar que não abordamos adequadamente uma questão, tem o direito de apresentar uma reclamação à autoridade supervisora local.

Para obter mais informações sobre as práticas da OpenAI em relação às informações pessoais que coletamos de você ou sobre você quando nosso site, aplicativos e serviços são usados, consulte nossa Política de Privacidade.

Como o ChatGPT e nossos modelos fundamentais são desenvolvidos

O que é o ChatGPT e como ele funciona?

Que tipo de informação é usada para ensinar o ChatGPT?

As informações pessoais são usadas para ensinar o ChatGPT?

Como o desenvolvimento do ChatGPT cumpre as leis de privacidade?

Este artigo foi útil?