OpenAI
Esta página foi traduzida automaticamente. Ver o artigo original em inglês.

Resumo dos Dados de Treino ao Abrigo da Secção 3111 do Código Civil da Califórnia

Atualizado: 13 days ago

A OpenAI disponibiliza sistemas públicos de IA generativa no estado da Califórnia. Desenvolvemos estes sistemas utilizando uma variedade de fontes de dados, incluindo dados publicamente disponíveis, dados aos quais acedemos em parceria com terceiros e informações que os nossos utilizadores ou formadores humanos e investigadores fornecem ou geram. Também desenvolvemos os nossos sistemas utilizando dados sintéticos.


Utilizamos dados para ajudar os nossos sistemas a compreender melhor a linguagem humana e o mundo. Isso, por sua vez, permite aos nossos sistemas reforçar a criatividade humana, promover a descoberta científica e a investigação médica, e permitir que centenas de milhões de pessoas melhorem a sua vida quotidiana. Os nossos sistemas são desenvolvidos com base em conjuntos de dados que contêm biliões de tokens de conteúdo textual, de imagem, áudio e audiovisual.


Utilizamos um conjunto diversificado de dados para desenvolver os nossos sistemas, incluindo dados que podem estar protegidos por direitos de autor e dados do domínio público. Embora tomemos medidas para reduzir a quantidade de informações pessoais nos nossos conjuntos de dados de treino, alguns dos nossos dados podem incluir informações pessoais e informações agregadas de consumidores, tal como definidas na Secção 1798.140 do Código Civil da Califórnia. Os nossos utilizadores têm a possibilidade de optar por excluir a utilização do seu conteúdo para treino, bem como de pedir a remoção de determinadas informações pessoais das respostas do ChatGPT, através do nosso Portal de Privacidade. Utilizamos várias técnicas para processar os nossos conjuntos de dados de modo a melhorar o desempenho e a precisão dos nossos modelos.


Começámos a recolher dados para desenvolver os nossos sistemas aproximadamente em 2018 e continuamos a recolher dados atualmente. Utilizámos os nossos conjuntos de dados pela primeira vez para o desenvolvimento de sistemas em 2021.


Informações adicionais sobre o desenvolvimento dos nossos sistemas podem ser consultadas nos nossos system cards.

Este artigo foi útil?