Saiba mais sobre como desenvolvemos os nossos modelos e os aplicamos em produtos como o ChatGPT

Os modelos de base da OpenAI, incluindo os modelos em que assenta o ChatGPT, são desenvolvidos com três fontes principais de informação: (1) informação disponível publicamente na internet, (2) informação a que acedemos em parceria com terceiros e (3) informação que os nossos utilizadores, formadores humanos e investigadores fornecem ou geram.

O desenvolvimento de modelos de base como os utilizados no ChatGPT envolve várias fases, incluindo a preparação de dados de treino, o pré-treinamento e o pós-treino, bem como a avaliação e melhoria contínuas após a implementação. Nestas fases, podem ser utilizados diferentes tipos de informação para diversos fins, incluindo melhorar o desempenho, a fiabilidade e a segurança dos modelos.

Este artigo apresenta uma visão geral da informação que utilizamos para ajudar a desenvolver estes modelos, da forma como recolhemos e utilizamos essa informação em conformidade com as leis de privacidade e das salvaguardas que aplicamos ao longo do processo de treino. Para compreender como recolhemos e utilizamos informação dos utilizadores dos nossos serviços, incluindo como recusar que as conversas do ChatGPT sejam utilizadas para ajudar a melhorar os nossos modelos, consulte a nossa Política de Privacidade e este artigo do centro de apoio.

O que é o ChatGPT e como funciona?

O ChatGPT é um serviço baseado em inteligência artificial a que pode aceder através da internet ou de uma aplicação. Pode utilizar o ChatGPT para uma ampla variedade de tarefas, incluindo organizar e resumir informação, ajudar em traduções, apoiar programação, investigação e análise, concluir tarefas com várias etapas em diferentes ferramentas, analisar ou gerar imagens, estimular a criatividade e ideias, e outras atividades do dia a dia. O ChatGPT foi concebido para compreender e responder a perguntas e instruções dos utilizadores, aprendendo padrões a partir de grandes volumes de informação, incluindo texto, imagens, áudio e vídeo.

Durante o treino, o modelo analisa relações nestes dados — como a forma como as palavras costumam aparecer juntas em contexto — e utiliza essa compreensão para prever a palavra seguinte mais provável ao gerar uma resposta, uma palavra de cada vez. O texto pode ser convertido em unidades mais pequenas, por vezes chamadas «tokens», que podem representar palavras inteiras, partes de palavras ou pontuação. Os tokens são os blocos de construção do texto que o modelo processa. Da mesma forma, os modelos que geram outras formas de conteúdo, como imagens, aprendem padrões na forma como os píxeis se relacionam entre si e com as legendas associadas nos dados de treino.

Por exemplo, durante o processo de aprendizagem do modelo (conhecido como «treino»), pode ser pedido ao modelo que complete uma frase como: «Em vez de virar à esquerda, ela virou à ___». No início do treino, as suas respostas são em grande parte aleatórias. No entanto, à medida que o modelo processa e aprende com um grande volume de texto, torna-se melhor a reconhecer padrões e a prever a palavra seguinte mais provável. Este processo é repetido em milhões de frases para aperfeiçoar a sua compreensão e melhorar a sua precisão.

Como há várias formas plausíveis de completar uma frase — como «Em vez de virar à esquerda, ela virou à direita», «para trás» ou «para trás, de volta» — existe um elemento inerente de aleatoriedade na forma como o modelo responde. Consequentemente, a mesma pergunta pode produzir respostas diferentes em consultas diferentes.

Os modelos de aprendizagem automática consistem em grandes conjuntos de números, conhecidos como «pesos» ou «parâmetros», juntamente com código que interpreta e utiliza esses números. Estes modelos não armazenam nem conservam cópias dos dados em que são treinados. Em vez disso, à medida que um modelo aprende, os valores dos seus parâmetros são ajustados ligeiramente para refletir padrões que identificou. No exemplo anterior, o modelo evoluiu de prever palavras aleatórias para fazer previsões mais precisas — não armazenando as frases de treino, mas atualizando os seus parâmetros internos. O modelo não conserva cópias das frases, imagens ou áudio que processa durante o treino. O ChatGPT não faz «copiar e colar» a partir dos seus dados de treino — de forma semelhante a um professor que, após estudo aprofundado, consegue explicar conceitos compreendendo as relações entre ideias, sem memorizar nem reproduzir literalmente os materiais originais. Ao gerar uma resposta a um pedido de um utilizador, o modelo utiliza estes pesos aprendidos para prever e criar novo conteúdo.

Que tipo de informação é utilizada para ensinar o ChatGPT?

No caso de conteúdos da internet disponíveis publicamente, utilizamos apenas informação que está livre e abertamente acessível na internet. Isto pode incluir páginas Web disponíveis publicamente, fóruns públicos, blogues públicos, publicações públicas e outros conteúdos online disponíveis publicamente. Por exemplo, se participar num fórum de discussão online disponível publicamente ou publicar um blogue público ou outra publicação pública, podemos utilizar esse conteúdo acessível publicamente para fins de treino de modelos. No entanto, tomamos medidas para reduzir o tratamento de informação pessoal no nosso processo de treino. Ao recolher conteúdos da internet disponíveis publicamente, não recolhemos intencionalmente dados de fontes que saibamos estar atrás de paywalls nem da dark web. Além disso, aplicamos filtros para remover material com o qual não queremos que os nossos modelos aprendam, como discurso de ódio, conteúdo para adultos, sites que agregam informação pessoal e spam. A informação restante é então utilizada para treinar os nossos modelos.

Os proprietários de sites podem gerir se o conteúdo disponível publicamente nos seus sites pode ser acedido para utilização no treino, recorrendo a controlos Web padrão, como robots.txt, para impedir o GPTBot, que pode rastrear conteúdo disponível publicamente para ajudar a treinar os nossos modelos. Disponibilizamos orientações para ajudar os proprietários de sites a gerir a forma como os seus sites e conteúdos interagem com os nossos sistemas de IA.

Também utilizamos informação de parceiros terceiros para ajudar a treinar e melhorar os nossos modelos. Isto pode incluir informação em conjuntos de dados a que acedemos através de acordos com terceiros, bem como informação fornecida ou gerada por formadores humanos e investigadores, quando permitido pelas nossas políticas e acordos. Isto ajuda a melhorar a qualidade, a segurança e o desempenho dos nossos modelos. Estas fontes podem incluir texto, imagens, áudio, vídeo ou outros tipos de dados, dependendo do conjunto de dados.

Também utilizamos cada vez mais dados sintéticos em alguns processos de treino. Por exemplo, podemos utilizar informação e os nossos modelos para gerar prompts sintéticos, exemplos multilingues ou outros materiais de treino. Os dados sintéticos podem ajudar a melhorar o desempenho dos modelos, nomeadamente complementando dados de treino em áreas onde os dados são escassos ou desequilibrados, e podem também apoiar abordagens de desenvolvimento de modelos que reforçam a privacidade.

É utilizada informação pessoal para ensinar o ChatGPT?

Uma parte significativa dos conteúdos online envolve informação sobre pessoas, pelo que os nossos dados de treino podem incluir incidentalmente informação pessoal. No entanto, tomamos medidas para reduzir o tratamento de informação pessoal no nosso processo de treino.

Utilizamos dados de treino para desenvolver as capacidades do modelo — como previsão, raciocínio e resolução de problemas — e não para criar perfis de indivíduos, contactá-los ou personalizar anúncios para eles.

Em alguns casos, os modelos podem aprender com informação pessoal para compreender como elementos como nomes e moradas funcionam na linguagem, ou para reconhecer figuras públicas e entidades bem conhecidas. Isto ajuda o modelo a gerar respostas mais precisas e adequadas ao contexto.

Como é protegida a informação pessoal durante o treino?

Tomamos medidas ativas para limitar o tratamento de informação pessoal durante o treino. Por exemplo, excluímos fontes conhecidas que agregam grandes quantidades de dados pessoais, aplicamos filtragem para reduzir a informação pessoal no processo de treino e tomamos medidas para identificar e remover conteúdo duplicado, reduzindo o risco de repetição de dados de treino. Além disso, treinamos os nossos modelos para evitarem responder a pedidos de informação privada ou sensível sobre indivíduos.

Durante quanto tempo conservamos informação

Conservamos informação nos dados de treino apenas durante o tempo razoavelmente necessário para as finalidades descritas neste artigo e na nossa Política de Privacidade, incluindo desenvolver e melhorar os nossos modelos e para fins de investigação científica relacionados. A conservação está sujeita a revisão periódica para assegurar que continua a ser necessária e varia consoante o tipo de informação e a forma como é utilizada. Ao determinar a conservação, consideramos fatores como a nossa finalidade no tratamento da informação, a quantidade, natureza e sensibilidade da informação, o risco potencial de dano decorrente de utilização ou divulgação não autorizada e quaisquer obrigações legais a que estejamos sujeitos.

Como é que o desenvolvimento do ChatGPT cumpre as leis de privacidade?

Utilizamos informação de treino de forma lícita. Os nossos modelos de base alimentam uma ampla variedade de aplicações benéficas — incluindo ferramentas de acessibilidade, apoio ao cliente, desenvolvimento de software, educação personalizada e investigação científica. Estas capacidades dependem de dados de treino em larga escala, incluindo informação disponível publicamente e informação de parceiros terceiros. Aplicamos salvaguardas ao longo de todo o processo de treino, incluindo medidas concebidas para reduzir o tratamento de informação pessoal no processo de treino e para mitigar riscos, conforme descrito neste artigo. Baseamos a nossa recolha e utilização de informação pessoal incluída em informação de treino em interesses legítimos ao abrigo de leis de privacidade como o RGPD, incluindo para treinar e melhorar os nossos modelos para os utilizadores e para a sociedade em geral, em linha com a nossa missão de garantir que a inteligência artificial geral beneficia todos, conforme explicado em maior detalhe na nossa Política de Privacidade. Concluímos uma avaliação de impacto sobre a proteção de dados para ajudar a garantir que recolhemos e utilizamos esta informação de forma legal e responsável.

Quando a informação pode ser partilhada ou transferida

Não «vendemos» informação pessoal e apenas divulgamos informação pessoal presente em dados de treino nas circunstâncias limitadas descritas na nossa Política de Privacidade. Por exemplo, podemos partilhar informação com afiliadas, fornecedores e prestadores de serviços que apoiam o desenvolvimento, os testes e a melhoria dos nossos modelos. Também podemos divulgar informação quando acreditamos de boa-fé que tal ação é necessária para cumprir uma obrigação legal ou para proteger os nossos direitos, segurança e proteção, bem como os dos nossos utilizadores, colaboradores ou do público, conforme descrito na nossa Política de Privacidade.

Como a nossa infraestrutura é global, a informação pessoal nos dados de treino pode ser tratada em países fora do EEE, da Suíça ou do Reino Unido (incluindo nos Estados Unidos). Quando isto acontece, aplicamos salvaguardas adequadas, como decisões de adequação ou cláusulas contratuais-tipo, conforme descrito na nossa Política de Privacidade.

Os seus direitos e como exercê-los

Respondemos a pedidos de oposição e a pedidos semelhantes relativos ao exercício de direitos. Em resultado da aprendizagem da linguagem, as respostas do ChatGPT podem, por vezes, incluir informação pessoal sobre indivíduos cuja informação pessoal aparece várias vezes na internet pública (por exemplo, figuras públicas). As pessoas em determinadas jurisdições podem opor-se ao tratamento da sua informação pessoal pelos nossos modelos ou apresentar outros pedidos relativos aos direitos dos titulares dos dados através do nosso Portal de Privacidade. Também pode exercer estes direitos contactando privacy@openai.com.

Para nos ajudar a avaliar e responder ao seu pedido, forneça informação suficiente para compreendermos a que informação pessoal o pedido diz respeito, como o seu nome, URLs relevantes, exemplos específicos de resultados do modelo ou outros detalhes que ajudem a identificar a questão. Em alguns casos, podemos pedir-lhe que verifique a sua identidade ou confirme que a informação lhe diz respeito antes de podermos tomar medidas. Está disponível mais informação sobre como apresentar estes pedidos, incluindo boas práticas e como os pedidos são analisados, no nosso artigo do Centro de Apoio sobre a remoção de dados pessoais do ChatGPT. Analisamos os pedidos de acordo com as leis de privacidade aplicáveis e respondemos dentro dos prazos legais aplicáveis.

Tenha em atenção que, de acordo com as leis de privacidade, alguns direitos podem não ser absolutos. Por exemplo, podemos não conseguir satisfazer um pedido quando não conseguimos verificar a informação relevante, quando o pedido não diz respeito a informação pessoal tratada pela OpenAI, quando se aplica uma isenção ou quando temos outro fundamento lícito para o fazer. Os pedidos são avaliados caso a caso e podem implicar a ponderação dos direitos de privacidade face a outras considerações importantes, como a liberdade de expressão e o interesse público.

No entanto, esforçamo-nos por dar prioridade à proteção da informação pessoal e cumprimos todas as leis de privacidade aplicáveis. Se considerar que não tratámos uma questão de forma adequada, tem o direito de apresentar uma reclamação junto da sua autoridade de controlo local.

Para obter mais informação sobre as práticas da OpenAI relativamente à informação pessoal que recolhemos de si ou sobre si quando utiliza o nosso site, aplicações e serviços, consulte a nossa Política de Privacidade.

Como o ChatGPT e os nossos modelos fundacionais são desenvolvidos

O que é o ChatGPT e como funciona?

Que tipo de informação é utilizada para ensinar o ChatGPT?

É utilizada informação pessoal para ensinar o ChatGPT?

Como é que o desenvolvimento do ChatGPT cumpre as leis de privacidade?

Este artigo foi útil?