OpenAI ofrece sistemas de IA generativa disponibles públicamente en el estado de California. Desarrollamos estos sistemas utilizando una variedad de fuentes de datos, incluidos datos disponibles públicamente, datos a los que accedemos en colaboración con terceros e información que nuestros usuarios o formadores humanos e investigadores proporcionan o generan. También desarrollamos nuestros sistemas utilizando datos sintéticos.
Usamos datos para ayudar a que nuestros sistemas comprendan mejor el lenguaje humano y el mundo. Eso, a su vez, permite que nuestros sistemas potencien la creatividad humana, impulsen el descubrimiento científico y la investigación médica, y permitan a cientos de millones de personas mejorar su vida cotidiana. Nuestros sistemas se desarrollan con conjuntos de datos que contienen billones de tokens de contenido textual, de imagen, de audio y audiovisual.
Utilizamos un conjunto diverso de datos para desarrollar nuestros sistemas, incluidos datos que pueden estar protegidos por derechos de autor y datos de dominio público. Aunque tomamos medidas para reducir la cantidad de información personal en nuestros conjuntos de datos de entrenamiento, algunos de nuestros datos pueden incluir información personal e información agregada de consumidores, tal como se define en la Sección 1798.140 del Código Civil de California. Nuestros usuarios pueden optar por que su contenido no se utilice para entrenamiento, así como solicitar la eliminación de cierta información personal de las respuestas de ChatGPT, mediante nuestro Portal de privacidad. Utilizamos diversas técnicas para procesar nuestros conjuntos de datos con el fin de mejorar el rendimiento y la precisión de nuestros modelos.
Empezamos a recopilar datos para desarrollar nuestros sistemas aproximadamente en 2018, y seguimos recopilando datos hoy en día. Utilizamos por primera vez nuestros conjuntos de datos para el desarrollo de sistemas en 2021.
Puede encontrar información adicional sobre el desarrollo de nuestros sistemas en nuestras tarjetas del sistema.
Resumen de datos de entrenamiento de conformidad con la Sección 3111 del Código Civil de California
Actualización: 13 days ago
