OpenAI
Esta página se tradujo automáticamente. Ver el artículo original en inglés.

Resumen de datos de entrenamiento de conformidad con la Sección 3111 del Código Civil de California

Actualización: 18 hours ago

OpenAI ofrece sistemas de IA generativa disponibles públicamente en el estado de California. Desarrollamos estos sistemas usando diversas fuentes de datos, incluidos datos disponibles públicamente, datos a los que accedemos en colaboración con terceros e información que nuestros usuarios, formadores humanos e investigadores proporcionan o generan. También desarrollamos nuestros sistemas usando datos sintéticos.

Usamos datos para ayudar a nuestros sistemas a comprender mejor el lenguaje humano y el mundo. Esto, a su vez, permite a nuestros sistemas potenciar la creatividad humana, impulsar los descubrimientos científicos y la investigación médica, y ayudar a cientos de millones de personas a mejorar su vida diaria. Nuestros sistemas se desarrollan con conjuntos de datos que contienen billones de tokens de contenido textual, de imagen, de audio y audiovisual.

Usamos un conjunto diverso de datos para desarrollar nuestros sistemas, incluidos datos que pueden estar protegidos por derechos de autor y datos de dominio público. Aunque tomamos medidas para reducir la cantidad de información personal en nuestros conjuntos de datos de entrenamiento, algunos de nuestros datos pueden incluir información personal e información agregada de consumidores, según se definen en el artículo 1798.140 del Código Civil de California. Nuestros usuarios pueden oponerse a que su contenido se use para entrenamiento, así como solicitar la eliminación de determinada información personal de las respuestas de ChatGPT, mediante nuestro Portal de privacidad. Usamos diversas técnicas para procesar nuestros conjuntos de datos con el fin de mejorar el rendimiento y la precisión de nuestros modelos.

Empezamos a recopilar datos para desarrollar nuestros sistemas aproximadamente en 2018, y seguimos recopilando datos en la actualidad. Usamos por primera vez nuestros conjuntos de datos para el desarrollo de sistemas en 2021.

Puede encontrarse información adicional sobre el desarrollo de nuestros sistemas en nuestras tarjetas del sistema.

¿Te ha resultado útil este artículo?