OpenAI

Cómo identificamos contenido problemático en nuestros servicios para personas

Última actualización: 23 days ago

Creemos en un desarrollo e implementación responsables e iterativos como un medio para lograr una inteligencia artificial general segura. Realizamos una cantidad considerable de pruebas y mitigación de seguridad y alineación antes de lanzar un modelo al público, y también contamos con sistemas automatizados y humanos para ayudar a detectar contenido problemático que aparece en nuestros servicios para personas, como ChatGPT y GPTs. A continuación, describimos algunos de esos esfuerzos.

ChatGPT, ImageGen y SORA

Usamos herramientas automatizadas, como una versión interna de nuestra API /moderations, para detectar contenido (prompts, completions, cargas) que pueda ser dañino o que infrinja nuestras Políticas de uso. Si detectamos contenido problemático, por lo general te avisaremos que tu contenido podría infringir nuestras Políticas de uso o bloquearemos que el modelo responda a tu prompt. También podemos impedir que se comparta el chat con el prompt o la completion problemáticos. En un conjunto muy limitado de circunstancias, también podemos suspender tu cuenta por conducta grave.

También aceptamos reportes de personas sobre contenido problemático en ChatGPT y SORA. Usamos una combinación de sistemas automatizados y un equipo de expertos capacitados para revisar estos reportes.

  • ChatGPT: Si alguien comparte un chat que tú consideras que contiene contenido problemático, también puedes reportárnoslo.

  • SORA: Si ves un video o una imagen en tu feed que consideras que contiene contenido problemático, puedes reportárnoslo.

Para obtener más detalles sobre cómo reportar contenido directamente en ChatGPT o SORA, consulta este artículo.

GPTs

También usamos herramientas automatizadas, como nuestra API /moderation, para ver si un GPT es potencialmente problemático. Si detectamos contenido problemático asociado con el GPT, tomaremos medidas, como impedir que se distribuya. El creador puede editar la configuración del GPT o la API para eliminar el contenido problemático, o puede apelar la decisión mediante un flujo dentro del producto. En un conjunto muy limitado de circunstancias, también podemos suspender la cuenta del creador por conducta grave.

También aceptamos reportes de personas sobre GPTs problemáticos. Si ves un GPT que consideras que está infringiendo nuestras Políticas de uso o que de otra manera refleja contenido problemático, también puedes reportárnoslo. Usamos una combinación de sistemas automatizados y un equipo de expertos capacitados para revisar estos reportes.

¿Este artículo te fue útil?