A OpenAI disponibiliza sistemas de AI generativa publicamente acessíveis no estado da Califórnia. Desenvolvemos estes sistemas utilizando várias fontes de dados, incluindo dados publicamente acessíveis, dados a que acedemos em parceria com terceiros e informações que os nossos utilizadores ou formadores e investigadores humanos fornecem ou geram. Também desenvolvemos os nossos sistemas utilizando dados sintéticos.
Utilizamos dados para ajudar os nossos sistemas a compreender melhor a linguagem humana e o mundo. Isso, por sua vez, permite que os nossos sistemas reforcem a criatividade humana, promovam a descoberta científica e a investigação médica, e permitam a centenas de milhões de pessoas melhorar o seu dia a dia. Os nossos sistemas são desenvolvidos com conjuntos de dados que contêm biliões de tokens de conteúdo textual, de imagem, áudio e audiovisual.
Utilizamos um conjunto diversificado de dados para desenvolver os nossos sistemas, incluindo dados que podem estar protegidos por direitos de autor e dados de domínio público. Embora tomemos medidas para reduzir a quantidade de informações pessoais nos nossos conjuntos de dados de treino, alguns dos nossos dados podem incluir informações pessoais e informações agregadas de consumidores, conforme definido na Secção 1798.140 do Código Civil da Califórnia. Os nossos utilizadores têm a possibilidade de optar por não permitir que o seu conteúdo seja utilizado para treino, bem como de solicitar a remoção de determinadas informações pessoais das respostas do ChatGPT, utilizando o nosso Portal de Privacidade. Utilizamos várias técnicas para processar os nossos conjuntos de dados, a fim de melhorar o desempenho e a precisão dos nossos modelos.
Começámos a recolher dados para desenvolver os nossos sistemas aproximadamente em 2018 e continuamos a recolher dados atualmente. Utilizámos pela primeira vez os nossos conjuntos de dados para o desenvolvimento de sistemas em 2021.
Pode encontrar informações adicionais sobre o desenvolvimento dos nossos sistemas nos nossos system cards.
Resumo dos Dados de Treino ao Abrigo da Secção 3111 do Código Civil da Califórnia
Atualizado: yesterday
