Creemos en el desarrollo y la implementación responsables e iterativos como medio para lograr una inteligencia artificial general segura. Realizamos una cantidad considerable de pruebas y mitigación de seguridad y alineación antes de lanzar cualquier modelo al público, y también contamos con sistemas automatizados y humanos para ayudar a detectar contenido problemático que aparece en nuestros servicios para personas, como ChatGPT y GPT. A continuación, describimos algunas de esas iniciativas.

ChatGPT e ImageGen

Usamos herramientas automatizadas, como una versión interna de nuestra API /moderations, para detectar contenido (prompt, finalizaciones, archivos cargados) que pueda ser perjudicial o infringir nuestras políticas de uso. Si detectamos contenido problemático, por lo general, o bien te advertiremos que tu contenido puede infringir nuestras políticas de uso o impediremos que el modelo responda a tu prompt. También podemos impedir que se comparta el chat que contiene el prompt problemático o la finalización problemática. En circunstancias limitadas, también podemos suspender tu cuenta por comportamiento grave.

También aceptamos informes de personas sobre contenido problemático en ChatGPT. Usamos una combinación de sistemas automatizados y un equipo de expertos capacitados para revisar estos informes.

ChatGPT: Si alguien comparte un chat que consideras que contiene contenido problemático, también puedes informarnos.

Para obtener más información sobre cómo denunciar contenido directamente en ChatGPT, consulta este artículo.

GPT

También usamos herramientas automatizadas, como nuestra API /moderation, para determinar si un GPT podría ser problemático. Si detectamos contenido problemático asociado con el GPT, tomaremos medidas, como impedir su distribución. El creador puede editar la configuración del GPT o de la API para quitar el contenido problemático o puede apelar la decisión mediante un flujo dentro del producto. En circunstancias limitadas, también podemos suspender la cuenta del creador por comportamiento grave.

También aceptamos informes de personas sobre GPT problemáticos. Si ves un GPT que consideras que infringe nuestras políticas de uso o que de otro modo refleja contenido problemático, también puedes informarnos. Usamos una combinación de sistemas automatizados y un equipo de expertos capacitados para revisar estos informes.

Cómo identificamos contenido problemático en nuestros servicios para personas

ChatGPT e ImageGen

GPT

¿Este artículo te fue útil?