Obtén información sobre los modelos de pesos abiertos de OpenAI (gpt-oss) y dónde recibir soporte

Nota: Este artículo ofrece una descripción general de alto nivel. La información para la configuración técnica se encuentra en el sitio web de gpt-oss, GitHub, Hugging Face y OpenAI Cookbooks.

Descripción general

Presentamos dos modelos de razonamiento de pesos abiertos: gpt‑oss‑120b y gpt‑oss‑20b. Se ejecutan en la infraestructura que tú controlas o mediante proveedores de hosting.

Nota: Estos modelos no se sirven mediante la API de OpenAI y no están disponibles en ChatGPT.

Por qué pesos abiertos

Elección y control: ejecuta modelos localmente o en tu nube privada, conserva la residencia de datos y adapta el rendimiento a tus necesidades.
Personalización: ajusta o adapta los modelos con tus herramientas abiertas preferidas.

Disponibilidad y licenciamiento

Licencia: Apache 2.0 permite un amplio uso, modificación y redistribución, incluido el uso comercial (sujeto a nuestra política de uso de gpt-oss).
Servicio: no está disponible mediante la API de OpenAI, por lo que no aplican los precios ni los límites de solicitudes de la API.
Compatibilidad: puede ejecutarse con stacks comunes de inferencia abierta, como vLLM, Ollama y llama.cpp, y en entornos de GPU en la nube o autogestionados.

Primeros pasos

Para obtener los pesos del modelo y recursos de apoyo, puedes:

Visita el sitio web de gpt-oss para ver una descripción general y enlaces directos.
Descarga los pesos desde la colección de Hugging Face, un centro comunitario donde puedes encontrar ambos modelos, ver ejemplos de uso y, opcionalmente, ejecutar inferencia directamente mediante los servicios de Hugging Face.
Accede a nuestro repositorio de GitHub para obtener código de inferencia de referencia.
Usa las guías del OpenAI Cookbook para configurar runtimes compatibles como Ollama, vLLM y Transformers. El Cookbook también incluye instrucciones paso a paso para ejecutar localmente, usar runtimes comunes y, cuando sea compatible, ajustar modelos gpt‑oss.

gpt‑oss‑safeguard (versión preliminar de investigación)

gpt‑oss‑safeguard es un par de modelos de razonamiento de seguridad de pesos abiertos creados sobre gpt‑oss. Están diseñados para la clasificación de seguridad basada en políticas y tareas relacionadas de confianza y seguridad que ejecutas en infraestructura que controlas. Al igual que otros modelos gpt‑oss, estos pesos no se sirven mediante la API de OpenAI ni ChatGPT.

Modelos solo de texto con esquemas de resultados estructurados de referencia (p. ej., veredicto de política, justificación).
Trae tu propia política: el modelo interpreta tu política escrita para generalizar entre productos con mínima ingeniería.
Decisiones razonadas: trazas de razonamiento opcionales para facilitar la depuración y las auditorías (destinadas a desarrolladores y profesionales de seguridad, no para mostrarlas a usuarios finales).
Esfuerzo de razonamiento configurable: elige bajo, medio o alto para equilibrar latencia y profundidad.
Licencia: Apache 2.0 (consulta Disponibilidad y licenciamiento más abajo).

gpt‑oss‑safeguard es adecuado para filtrar entradas y salidas de LLM, etiquetar contenido en línea y flujos de trabajo de etiquetado o revisión por lotes sin conexión. Para aplicaciones generales (chat, agentes, etc.), recomendamos los modelos gpt‑oss principales.

Puedes adaptar el esquema a tus necesidades. Consulta el OpenAI Cookbook para ver guías sobre prompting y ejemplos.

Variantes de modelo y tamaño

Modelo	Uso previsto	Notas
gpt‑oss‑safeguard‑120b	Producción, razonamiento de seguridad de alta capacidad	117 mil millones de parámetros (≈5,1 mil millones activos). Diseñado para caber en una sola GPU de 80 GB (p. ej., NVIDIA H100; también se ejecuta en GPU con más memoria, como AMD MI300X).
gpt‑oss‑safeguard‑20b	Entornos con menor latencia o restricciones	21 mil millones de parámetros (≈3,6 mil millones activos).

Ambos modelos están ajustados a partir de gpt‑oss sin cambios de arquitectura. Usan la misma plantilla de chat que gpt‑oss; puedes conservar tu configuración existente. Un patrón de prompting recomendado es colocar tu política en un mensaje de desarrollador y el contenido a evaluar en un mensaje de usuario.

Soporte y comunidad

Las implementaciones de pesos abiertos son autogestionadas y con autoservicio. Aquí puedes obtener soporte:

Preguntas, debate, consejos: usa las páginas de modelos de Hugging Face para interactuar con la comunidad.
Errores reproducibles en el código de inferencia de referencia de OpenAI: abre un issue en el repositorio de GitHub de gpt-oss.
Problemas con un runtime de terceros (p. ej., vLLM, Ollama, llama.cpp): usa el gestor de issues, los foros o el proceso de soporte del proyecto correspondiente.

OpenAI no brinda asistencia, implementación práctica ni soporte de depuración para configuraciones, entornos o aplicaciones de pesos abiertos autoalojados o alojados por terceros.

Seguiremos iterando con la comunidad para mejorar las herramientas abiertas de seguridad, incluso mediante la ROOST Model Community (RMC). La RMC reúne a profesionales e investigadores de seguridad para compartir prácticas recomendadas para implementar modelos de IA de código abierto en flujos de trabajo de seguridad, incluidos resultados de evaluación y comentarios sobre modelos. Visita el repositorio de GitHub de RMC para obtener más información sobre esta colaboración y cómo participar.

Soporte y comunidad

Las implementaciones de pesos abiertos son autogestionadas y con autoservicio. Aquí puedes obtener soporte:

Preguntas, debate, consejos: usa las páginas de modelos de Hugging Face para interactuar con la comunidad.
Errores reproducibles en el código de inferencia de referencia de OpenAI: abre un issue en el repositorio de GitHub de gpt-oss.
Problemas con un runtime de terceros (p. ej., vLLM, Ollama, llama.cpp): usa el gestor de issues, los foros o el proceso de soporte del proyecto correspondiente.

OpenAI no brinda asistencia, implementación práctica ni soporte de depuración para configuraciones, entornos o aplicaciones de pesos abiertos autoalojados o alojados por terceros.

Privacidad y seguridad

Privacidad y datos

Estos modelos están diseñados para ejecutarse en infraestructura que controlas (localmente o en tu nube o socio de hosting). OpenAI no recibe ni procesa los datos que envías a estos modelos autoalojados, salvo que los compartas explícitamente con OpenAI o uses uno de nuestros socios de hosting gestionado.

Seguridad

Estos modelos pasaron por amplias pruebas y entrenamiento de seguridad. Para obtener más detalles, consulta nuestra tarjeta del modelo y el informe técnico.

Reportar infracciones de contenido

Si crees que el contenido generado con modelos gpt‑oss infringe nuestras políticas, puedes reportarlo mediante nuestro formulario para reportar contenido. Proporciona tantos detalles como sea posible para ayudar a nuestro equipo a revisar tu envío.

Preguntas frecuentes

¿Estos modelos son gratis?

Los pesos del modelo gpt-oss se pueden descargar y usar gratis bajo la licencia Apache 2.0 y la política de uso de gpt-oss. Sin embargo, eres responsable de cualquier costo asociado con su ejecución, como cómputo, almacenamiento o tarifas de hosting de terceros. Los precios dependerán de la infraestructura o el proveedor que elijas.

¿Estos modelos son de “código abierto”?

Usamos el término modelos abiertos o pesos abiertos para indicar que los pesos entrenados están disponibles públicamente bajo la licencia permisiva Apache 2.0 y la política de uso de gpt-oss. Esto significa que puedes descargar los modelos, ejecutarlos en tu propia infraestructura o con frameworks de hosting compatibles, y personalizarlos o ajustarlos.

Los modelos abiertos les dan a desarrolladores y organizaciones mayor control y flexibilidad. Puedes elegir dónde alojarlos, adaptar los modelos a casos de uso específicos y beneficiarte de una licencia que permite un amplio uso, modificación y redistribución. Aunque los pesos entrenados son abiertos, parte de la infraestructura o las herramientas relacionadas pueden seguir siendo propietarias de sus proveedores.

¿Puedo acceder a estos modelos mediante la API de OpenAI o ChatGPT?

No. Estos modelos no se sirven en la API de OpenAI y no aparecen en ChatGPT.

¿Puedo ajustar los modelos?

Sí. Puedes ajustarlos con herramientas de código abierto y tu infraestructura preferida. No ofrecemos ajuste mediante las API de OpenAI para estos modelos.

¿Los modelos de pesos abiertos son más baratos que usar la API?

Los costos varían según la infraestructura, la carga de trabajo y el enfoque operativo. El autoalojamiento puede ser más barato en algunos casos, mientras que nuestra plataforma de API puede ser más eficiente al considerar hosting, mantenimiento y actualizaciones.

¿Qué funciones admiten estos modelos?

Actualmente, estos modelos son modelos de razonamiento solo de texto. Los runtimes comunes admiten streaming, llamada a funciones y resultados estructurados. Consulta la documentación de tu runtime para conocer sus capacidades exactas.

¿En qué se diferencia de ModAPI?

Este es un modelo de razonamiento muy capaz que te permite traer tu propia política. Puede funcionar junto con ModAPI, pero probablemente no sea un reemplazo para casos de uso de baja latencia.

Modelos de pesos abiertos de OpenAI (gpt-oss)

Descripción general

Por qué pesos abiertos

Disponibilidad y licenciamiento

Primeros pasos

gpt‑oss‑safeguard (versión preliminar de investigación)

Variantes de modelo y tamaño

Soporte y comunidad

Soporte y comunidad

Privacidad y seguridad

Privacidad y datos

Seguridad

Reportar infracciones de contenido

Preguntas frecuentes

¿Estos modelos son gratis?

¿Estos modelos son de “código abierto”?

¿Puedo acceder a estos modelos mediante la API de OpenAI o ChatGPT?

¿Puedo ajustar los modelos?

¿Los modelos de pesos abiertos son más baratos que usar la API?

¿Qué funciones admiten estos modelos?

¿En qué se diferencia de ModAPI?

¿Este artículo te fue útil?