Skip to main content

Cómo se desarrolla ChatGPT y nuestros modelos fundacionales

Descubra cómo desarrollamos nuestros modelos y los aplicamos aproductos como ChatGPT

Updated over 2 months ago

Los modelos fundacionales de OpenAI, entre los que se incluyen los modelos que alimentan ChatGPT, se desarrollan utilizando tres fuentes principales de información: 1) información disponible públicamente en internet; 2) información a la que accedemos a raíz de asociarnos con terceros; y 3) información que proporcionan o generan nuestros usuarios o nuestros entrenadores e investigadores (humanos).

Este artículo ofrece una visión general sobre la información disponible públicamente que utilizamos para ayudar a desarrollar estos modelos y sobre cómo recabamos y utilizamos esa información, en cumplimiento con la normativa sobre privacidad y protección de datos. Para entender cómo recabamos y utilizamos la información de los usuarios de nuestros servicios, incluido cómo oponerse a que se utilicen las conversaciones de ChatGPT para ayudar a enseñar a nuestros modelos, consulte nuestra Política de privacidad y este artículo del centro de ayuda.

¿Qué es ChatGPT y cómo funciona?

ChatGPT es un servicio basado en inteligencia artificial al que puede acceder a través de internet. Puede usar ChatGPT para una variedad de tareas, como organizar o resumir información, traducir textos, analizar o generar una imagen, inspirar su creatividad y obtener ideas y obtener ayuda con las tareas del día a día. ChatGPT ha sido desarrollado de manera que pueda entender y responder a las preguntas e instrucciones de los usuarios. Para ello, revisa una gran cantidad de información existente, como texto, imágenes, audio o vídeo, y aprende de las relaciones existentes en la información. Por ejemplo, el modelo aprende cómo suelen aparecer las palabras en contexto con otras palabras y, a continuación, utiliza lo aprendido para predecir la siguiente palabra que, con mayor probabilidad, podría aparecer en respuesta a una petición del usuario, y cada palabra posterior después de esta. Estos modelos también pueden aprender a generar otras formas de información, como imágenes, aprendiendo cómo se relacionan entre sí los píxeles que componen las imágenes en los datos de entrenamiento y los conceptos que las describen.

Por ejemplo, durante el proceso de aprendizaje del modelo (llamado el "entrenamiento"), podríamos hacer que un modelo intentara completar la frase "en lugar de girar a la izquierda, giró ___". Antes del entrenamiento, el modelo responderá con palabras aleatorias, pero a medida que lee y aprende de muchas líneas de texto, entiende mejor este tipo de frase y puede predecir la siguiente palabra con mayor precisión. Después repite este proceso con un gran número de frases.

Como hay muchas posibles palabras que podrían continuar esta frase (por ejemplo, en lugar de girar a la izquierda, giró "a la derecha", "de vuelta" o "hacia atrás"), hay un elemento de aleatoriedad en la forma en que un modelo puede responder y, en muchos casos, nuestros modelos responderán a la misma pregunta de diferentes maneras.

Los modelos de aprendizaje automático (machine learning) se componen de grandes cadenas de números, llamados "pesos" (weights) o "parámetros", y de código que interpreta y ejecuta esos números. Los modelos no contienen ni almacenan copias de la información de la que aprenden. En cambio, a medida que un modelo aprende, algunos de los números que componen el modelo cambian ligeramente para reflejar lo que ha aprendido. En el ejemplo anterior, el modelo revisó información que le ayudó a pasar de predecir palabras incorrectas al azar a predecir palabras más precisas, pero lo único que ocurrió en realidad en el propio modelo fue que los números cambiaron ligeramente. El modelo no almacenó ni copió las frases, imágenes o audio que revisó.

¿Qué tipo de información se utiliza para enseñar a ChatGPT?

Como se ha indicado anteriormente, ChatGPT y el resto de nuestros servicios se han desarrollado utilizando 1) información disponible públicamente en internet; 2) información a la que accedemos a raíz de asociarnos con terceros; y 3) información que proporcionan o generan nuestros usuarios o nuestros entrenadores e investigadores (humanos). Este artículo se centra en el primer grupo: la información disponible públicamente en internet.

Para este conjunto de información, solo utilizamos la información que está públicamente disponible en internet de forma gratuita y abierta. Por ejemplo, no buscamos información que sabemos que se encuentra detrás de paywalls (muros de pago) o de la dark web. Aplicamos filtros y eliminamos la información de la que no queremos que nuestros modelos aprendan o produzcan respuestas, como discursos de odio, contenido para adultos, páginas web que principalmente agregan datos personales y spam. Tras ello, utilizamos la información para enseñar a nuestros modelos.

Como se ha mencionado en la sección anterior, ChatGPT no copia ni almacena información de entrenamiento en ninguna base de datos. En su lugar, aprende sobre las asociaciones entre palabras y conceptos, y esos aprendizajes ayudan al modelo a actualizar sus números o pesos / proporciones. A continuación, el modelo utiliza esos “pesos” para predecir y generar nuevo contenido en respuesta a una petición del usuario. No "copia y pega" la información de entrenamiento, sino que actúa más como un docente que ha aprendido tras largas horas de estudio y puede explicar las cosas porque entiende las relaciones entre los conceptos, no porque almacene copias de los materiales en su cabeza.

¿Se utilizan datos personales para enseñar a ChatGPT?

En internet, hay una gran cantidad de datos que se refieren a personas, por lo que nuestra información de entrenamiento incluye, incidentalmente, datos personales. Sin embargo, no buscamos proactivamente datos personales para entrenar a nuestros modelos.

Utilizamos información de entrenamiento solamente para enseñar y dotar a nuestros modelos de “inteligencia”, como la capacidad de predecir, razonar y solucionar problemas. No utilizamos ni utilizaremos ningún dato personal incluido en la información de entrenamiento para elaborar perfiles de personas, ponernos en contacto con ellas, hacerles llegar publicidad, intentar venderles nada ni comerciar con los propios datos.

Nuestros modelos pueden aprender de los datos personales para entender cómo encajan ciertos elementos, como nombres y direcciones, en el lenguaje y las frases, o para aprender sobre personas famosas y personajes públicos. Esto hace que nuestros modelos sean mejores a la hora de ofrecer respuestas pertinentes.

También tomamos medidas para reducir el tratamiento de datos personales cuando entrenamos nuestros modelos. Por ejemplo, excluimos los sitios web que agregan grandes volúmenes de datos personales y entrenamos nuestros modelos para que rechacen las solicitudes de información privada o sensible sobre las personas.

¿Cómo cumple el desarrollo de ChatGPT la legislación en materia de privacidad y protección de datos?

Utilizamos la información de entrenamiento de forma lícita. Nuestros modelos fundacionales tienen muchas aplicaciones que proporcionan importantes beneficios y que ya están ayudando a personas a crear contenidos, mejorar la atención al cliente, desarrollar software, personalizar la educación y apoyar la investigación científica, y muchas más. Estos beneficios no pueden alcanzarse si no se cuenta con una gran cantidad de información para enseñar a los modelos. Además, nuestro uso de la información de entrenamiento no pretende afectar negativamente a las personas, y las fuentes principales de esta información de entrenamiento ya están disponibles al público. Por estas razones, basamos nuestra obtención y uso de los datos personales que se incluyen en la información de entrenamiento en intereses legítimos de acuerdo con leyes de privacidad y protección de datos como el RGPD, tal y como se explica con más detalle en nuestra Política de Privacidad. También hemos llevado a cabo una evaluación de impacto relativa a la protección de datos para ayudar a garantizar que estamos recabando y utilizando esta información de manera legal y responsable.

Respondemos a solicitudes de oposición y derechos similares. Como resultado del aprendizaje sobre el lenguaje, las respuestas de ChatGPT a veces pueden incluir datos personales sobre individuos cuya información aparece en múltiples ocasiones en internet (por ejemplo, figuras o personajes públicos). En determinadas jurisdicciones los interesados pueden oponerse al tratamiento de sus datos personales por parte de nuestros modelos o presentar otras solicitudes de derechos de protección de datos, a través de nuestro Centro de Privacidad. También puede ejercer estos derechos dirigiéndose a dsar@openai.com.

Tenga en cuenta que, de conformidad con la normativa en materia de privacidad y protección de datos, algunos derechos pueden no ser absolutos. Podremos rechazar una solicitud si tenemos un motivo legítimo para hacerlo. No obstante, nos esforzamos por dar prioridad a la protección de los datos personales y por cumplir con la normativa aplicable de protección de datos y privacidad. Si considera que no hemos abordado adecuadamente una cuestión, tiene derecho a presentar una reclamación ante su autoridad supervisora local.

Para obtener más información sobre las prácticas de OpenAI en relación con los datos personales que recabamos de o sobre usted al utilizar nuestro sitio web, aplicaciones y servicios, consulte nuestra Política de Privacidad.

Did this answer your question?