Más información sobre cómo desarrollamos nuestros modelos y los aplicamos en productos como ChatGPT

Los modelos fundacionales de OpenAI, incluidos los modelos que impulsan ChatGPT, se desarrollan utilizando tres fuentes principales de información: (1) información disponible públicamente en internet, (2) información a la que accedemos mediante acuerdos con terceros y (3) información que nuestros usuarios, formadores humanos e investigadores proporcionan o generan.

El desarrollo de modelos fundacionales como los utilizados en ChatGPT consta de varias etapas, entre ellas la preparación de datos de entrenamiento, el preentrenamiento y el postentrenamiento, así como la evaluación y mejora continuas tras su despliegue. En estas etapas pueden utilizarse distintos tipos de información con diversos fines, entre ellos mejorar el rendimiento, la fiabilidad y la seguridad del modelo.

Este artículo ofrece una visión general de la información que utilizamos para ayudar a desarrollar estos modelos, de cómo recopilamos y utilizamos dicha información de conformidad con las leyes de privacidad y de las salvaguardias que aplicamos durante todo el proceso de entrenamiento. Para entender cómo recopilamos y utilizamos información de los usuarios de nuestros servicios, incluido cómo oponerte a que las conversaciones de ChatGPT se utilicen para ayudar a mejorar nuestros modelos, consulta nuestra Política de privacidad y este artículo del centro de ayuda.

¿Qué es ChatGPT y cómo funciona?

ChatGPT es un servicio basado en inteligencia artificial al que puedes acceder a través de internet o de una aplicación. Puedes usar ChatGPT para una amplia variedad de tareas, como organizar y resumir información, ayudar con traducciones, prestar apoyo en programación, investigación y análisis, completar tareas de varios pasos en distintas herramientas, analizar o generar imágenes, inspirar creatividad e ideas, y otras actividades cotidianas. ChatGPT está diseñado para comprender y responder a las preguntas e instrucciones de los usuarios aprendiendo patrones a partir de grandes cantidades de información, incluidos texto, imágenes, audio y vídeo.

Durante el entrenamiento, el modelo analiza las relaciones dentro de estos datos —por ejemplo, cómo suelen aparecer juntas las palabras en contexto— y utiliza esa comprensión para predecir la siguiente palabra más probable al generar una respuesta, palabra por palabra. El texto puede convertirse en unidades más pequeñas, a veces llamadas «tokens», que pueden representar palabras completas, partes de palabras o signos de puntuación. Los tokens son los componentes básicos del texto que procesa el modelo. Del mismo modo, los modelos que generan otras formas de contenido, como imágenes, aprenden patrones sobre cómo se relacionan los píxeles entre sí y con los pies de foto asociados en los datos de entrenamiento.

Por ejemplo, durante el proceso de aprendizaje del modelo (conocido como «entrenamiento»), se le podría pedir que completara una frase como: «En lugar de girar a la izquierda, ella giró a la ___». Al principio del entrenamiento, sus respuestas son en gran medida aleatorias. Sin embargo, a medida que el modelo procesa y aprende de un gran volumen de texto, mejora su capacidad para reconocer patrones y predecir la siguiente palabra más probable. Este proceso se repite en millones de frases para perfeccionar su comprensión y mejorar su precisión.

Como hay varias formas plausibles de completar una frase —por ejemplo, «En lugar de girar a la izquierda, ella giró a la derecha», «alrededor» o «hacia atrás»—, existe un elemento inherente de aleatoriedad en la forma en que responde el modelo. Como resultado, la misma pregunta puede dar lugar a respuestas distintas en consultas diferentes.

Los modelos de aprendizaje automático consisten en grandes conjuntos de números, conocidos como «pesos» o «parámetros», junto con código que interpreta y utiliza esos números. Estos modelos no almacenan ni conservan copias de los datos con los que se entrenan. En cambio, a medida que un modelo aprende, los valores de sus parámetros se ajustan ligeramente para reflejar los patrones que ha identificado. En el ejemplo anterior, el modelo pasó de predecir palabras aleatorias a hacer predicciones más precisas, no almacenando las frases de entrenamiento, sino actualizando sus parámetros internos. El modelo no conserva copias de las frases, imágenes o audio que procesa durante el entrenamiento. ChatGPT no «copia y pega» de sus datos de entrenamiento, de forma similar a como un profesor, tras estudiar mucho, puede explicar conceptos comprendiendo las relaciones entre ideas sin memorizar ni reproducir literalmente los materiales originales. Al generar una respuesta a una solicitud de un usuario, el modelo utiliza estos pesos aprendidos para predecir y crear contenido nuevo.

¿Qué tipo de información se utiliza para enseñar a ChatGPT?

En cuanto al contenido de internet disponible públicamente, solo utilizamos información de acceso libre y abierto en internet. Esto puede incluir páginas web disponibles públicamente, foros públicos, blogs públicos, publicaciones públicas y otro contenido en línea disponible públicamente. Por ejemplo, si participas en un foro de debate en línea disponible públicamente o publicas un blog u otra publicación pública, podemos utilizar ese contenido de acceso público con fines de entrenamiento del modelo. No obstante, tomamos medidas para reducir el tratamiento de información personal en nuestro proceso de entrenamiento. Al recopilar contenido de internet disponible públicamente, no recabamos intencionadamente datos de fuentes que se sabe que están tras muros de pago ni de la web oscura. Además, aplicamos filtros para eliminar material del que no queremos que aprendan nuestros modelos, como discurso de odio, contenido para adultos, sitios que agregan información personal y spam. La información restante se utiliza entonces para entrenar nuestros modelos.

Los propietarios de sitios web pueden gestionar si el contenido disponible públicamente de sus sitios puede ser accedido para su uso en el entrenamiento mediante controles web estándar, como robots.txt, para denegar el acceso a GPTBot, que puede rastrear contenido disponible públicamente para ayudar a entrenar nuestros modelos. Ofrecemos orientación para ayudar a los propietarios de sitios web a gestionar cómo interactúan sus sitios y contenidos con nuestros sistemas de IA.

También utilizamos información de socios externos para ayudar a entrenar y mejorar nuestros modelos. Esto puede incluir información de conjuntos de datos a los que accedemos mediante acuerdos con terceros, así como información proporcionada o generada por formadores humanos e investigadores cuando lo permiten nuestras políticas y acuerdos. Esto ayuda a mejorar la calidad, la seguridad y el rendimiento de nuestros modelos. Estas fuentes pueden incluir texto, imágenes, audio, vídeo u otros tipos de datos, en función del conjunto de datos.

También utilizamos cada vez más datos sintéticos en algunos procesos de entrenamiento. Por ejemplo, podemos utilizar información y nuestros modelos para generar prompts sintéticos, ejemplos multilingües u otros materiales de entrenamiento. Los datos sintéticos pueden ayudar a mejorar el rendimiento del modelo, entre otras cosas complementando los datos de entrenamiento en áreas donde los datos son escasos o están desequilibrados, y también pueden respaldar enfoques de desarrollo de modelos que mejoran la privacidad.

¿Se utiliza información personal para enseñar a ChatGPT?

Una parte importante del contenido en línea contiene información sobre personas, por lo que nuestros datos de entrenamiento pueden incluir incidentalmente información personal. No obstante, tomamos medidas para reducir el tratamiento de información personal en nuestro proceso de entrenamiento.

Utilizamos datos de entrenamiento para desarrollar las capacidades del modelo —como la predicción, el razonamiento y la resolución de problemas—, no para crear perfiles de personas, contactar con ellas ni personalizar anuncios para ellas.

En algunos casos, los modelos pueden aprender de información personal para comprender cómo funcionan en el lenguaje elementos como nombres y direcciones, o para reconocer figuras públicas y entidades conocidas. Esto ayuda al modelo a generar respuestas más precisas y adecuadas al contexto.

¿Cómo se protege la información personal durante el entrenamiento?

Tomamos medidas activas para limitar el tratamiento de información personal durante el entrenamiento. Por ejemplo, excluimos fuentes conocidas que agregan grandes cantidades de datos personales, aplicamos filtros para reducir la información personal en el proceso de entrenamiento y adoptamos medidas para identificar y eliminar contenido duplicado con el fin de reducir el riesgo de repetir datos de entrenamiento. Además, entrenamos nuestros modelos para que eviten responder a solicitudes de información privada o sensible sobre personas.

Durante cuánto tiempo conservamos la información

Conservamos la información de los datos de entrenamiento solo durante el tiempo razonablemente necesario para los fines descritos en este artículo y en nuestra Política de privacidad, incluidos el desarrollo y la mejora de nuestros modelos y fines de investigación científica relacionados. La conservación está sujeta a revisiones periódicas para garantizar que sigue siendo necesaria, y varía según el tipo de información y cómo se utilice. Al determinar la conservación, tenemos en cuenta factores como nuestra finalidad al tratar la información, la cantidad, naturaleza y sensibilidad de la información, el riesgo potencial de daños por un uso o divulgación no autorizados y cualquier obligación legal a la que estemos sujetos.

¿Cómo cumple el desarrollo de ChatGPT las leyes de privacidad?

Utilizamos información de entrenamiento de forma lícita. Nuestros modelos fundacionales impulsan una amplia variedad de aplicaciones beneficiosas, incluidas herramientas de accesibilidad, atención al cliente, desarrollo de software, educación personalizada e investigación científica. Estas capacidades dependen de datos de entrenamiento a gran escala, incluida información disponible públicamente e información de socios externos. Aplicamos salvaguardias durante todo el proceso de entrenamiento, incluidas medidas diseñadas para reducir el tratamiento de información personal en dicho proceso y mitigar riesgos, como se describe en este artículo. Basamos la recopilación y el uso de información personal incluida en la información de entrenamiento en intereses legítimos con arreglo a leyes de privacidad como el RGPD, entre ellos entrenar y mejorar nuestros modelos para los usuarios y la sociedad en general de acuerdo con nuestra misión de garantizar que la inteligencia artificial general beneficie a todos, como se explica con más detalle en nuestra Política de privacidad. Hemos realizado una evaluación de impacto relativa a la protección de datos para ayudar a garantizar que recopilamos y utilizamos esta información de forma legal y responsable.

Cuándo puede compartirse o transferirse la información

No «vendemos» información personal, y solo divulgamos información personal en datos de entrenamiento en las circunstancias limitadas descritas en nuestra Política de privacidad. Por ejemplo, podemos compartir información con filiales, proveedores y prestadores de servicios que apoyan el desarrollo, las pruebas y la mejora de nuestros modelos. También podemos divulgar información cuando creamos de buena fe que dicha acción es necesaria para cumplir una obligación legal o para proteger nuestros derechos, seguridad y protección, así como los de nuestros usuarios, empleados o el público, como se describe en nuestra Política de privacidad.

Dado que nuestra infraestructura es global, la información personal incluida en los datos de entrenamiento puede tratarse en países fuera del EEE, Suiza o el Reino Unido (incluidos los Estados Unidos). Cuando esto ocurre, aplicamos salvaguardias adecuadas, como decisiones de adecuación o cláusulas contractuales tipo, según se describe en nuestra Política de privacidad.

Tus derechos y cómo ejercerlos

Atendemos las solicitudes de oposición y solicitudes similares de ejercicio de derechos. Como resultado del aprendizaje del lenguaje, las respuestas de ChatGPT pueden incluir a veces información personal sobre personas cuya información personal aparece varias veces en internet público (por ejemplo, figuras públicas). Las personas de determinadas jurisdicciones pueden oponerse al tratamiento de su información personal por parte de nuestros modelos o presentar otras solicitudes de ejercicio de derechos de los interesados a través de nuestro Portal de privacidad. También puedes ejercer estos derechos escribiendo a privacy@openai.com.

Para ayudarnos a evaluar tu solicitud y responder a ella, proporciona información suficiente para que podamos entender a qué información personal se refiere, como tu nombre, URL relevantes, ejemplos concretos de resultados del modelo u otros detalles que ayuden a identificar el problema. En algunos casos, podemos pedirte que verifiques tu identidad o confirmes que la información se refiere a ti antes de que podamos tomar medidas. Hay más información sobre cómo presentar estas solicitudes, incluidas buenas prácticas y cómo se revisan las solicitudes, en nuestro artículo del centro de ayuda sobre la eliminación de datos personales de ChatGPT. Revisamos las solicitudes de conformidad con las leyes de privacidad aplicables y respondemos dentro de los plazos legales correspondientes.

Ten en cuenta que, de conformidad con las leyes de privacidad, algunos derechos pueden no ser absolutos. Por ejemplo, es posible que no podamos atender una solicitud si no podemos verificar la información pertinente, si la solicitud no se refiere a información personal tratada por OpenAI, si se aplica una exención o si tenemos otro motivo lícito para hacerlo. Las solicitudes se evalúan caso por caso y pueden implicar ponderar los derechos de privacidad frente a otras consideraciones importantes, como la libertad de expresión y el interés público.

No obstante, nos esforzamos por priorizar la protección de la información personal y cumplimos todas las leyes de privacidad aplicables. Si consideras que no hemos abordado adecuadamente un problema, tienes derecho a presentar una reclamación ante tu autoridad de control local.

Para obtener más información sobre las prácticas de OpenAI con respecto a la información personal que recopilamos de ti o sobre ti cuando utilizas nuestro sitio web, aplicaciones y servicios, consulta nuestra Política de privacidad.

Cómo se desarrollan ChatGPT y nuestros modelos fundacionales

¿Qué es ChatGPT y cómo funciona?

¿Qué tipo de información se utiliza para enseñar a ChatGPT?

¿Se utiliza información personal para enseñar a ChatGPT?

¿Cómo cumple el desarrollo de ChatGPT las leyes de privacidad?

¿Te ha resultado útil este artículo?