OpenAI
Esta página se tradujo automáticamente. Ver el artículo original en inglés.

Modelos de pesos abiertos de OpenAI (gpt-oss)

Conoce los modelos de pesos abiertos de OpenAI (gpt-oss) y dónde obtener soporte

Última actualización: 2 days ago

Nota: Este artículo ofrece una descripción general de alto nivel. La información para la configuración técnica se puede encontrar en el sitio web de gpt-oss, GitHub, Hugging Face y OpenAI Cookbooks.

Resumen

Presentamos dos modelos de razonamiento de pesos abiertos: gpt‑oss‑120b y gpt‑oss‑20b. Se ejecutan en infraestructura que tú controlas o a través de proveedores de hosting.

Nota: Estos modelos no se sirven a través de la API de OpenAI y no están disponibles en ChatGPT.

Por qué pesos abiertos

  • Elección y control: Ejecuta los modelos on‑premises o en tu nube privada, conserva la residencia de datos y ajusta el rendimiento a tus necesidades.

  • Personalización: Afina (fine‑tune) o adapta los modelos con tus herramientas abiertas preferidas.

Disponibilidad y licenciamiento

  • Licencia: Apache 2.0 permite un uso, modificación y redistribución amplios, incluido el uso comercial (sujeto a nuestra política de uso de gpt-oss).

  • Servicio: No está disponible a través de la API de OpenAI, por lo que no aplican los precios de la API ni los límites de tasa.

  • Compatibilidad: Se puede ejecutar con stacks de inferencia abiertos comunes como vLLM, Ollama, llama.cpp, y en entornos de GPU en la nube o autogestionados.

Primeros pasos

Para obtener los pesos del modelo y recursos de soporte, puedes:

  • Visitar el sitio web de gpt-oss para una descripción general y enlaces directos.

  • Descargar los pesos desde la colección de Hugging Face — un hub de la comunidad donde puedes encontrar ambos modelos, ver ejemplos de uso y, opcionalmente, ejecutar inferencia directamente a través de los servicios de Hugging Face.

  • Acceder a nuestro repo de GitHub para ver código de inferencia de referencia.

  • Usar las guías del OpenAI Cookbook para la configuración con runtimes compatibles como Ollama, vLLM y Transformers. El Cookbook también incluye instrucciones paso a paso para ejecutar localmente, usar runtimes comunes y—donde sea compatible—afinar (fine‑tune) modelos gpt‑oss.

gpt‑oss‑safeguard (vista previa de investigación)

gpt‑oss‑safeguard es un par de modelos de razonamiento de seguridad de pesos abiertos construidos sobre gpt‑oss. Están diseñados para la clasificación de seguridad basada en políticas y tareas relacionadas de trust & safety que ejecutas en infraestructura que tú controlas. Al igual que otros modelos gpt‑oss, estos pesos no se sirven a través de la API de OpenAI ni de ChatGPT.

  • Modelos solo de texto con esquemas de salida estructurada de referencia (p. ej., veredicto de política, justificación).

  • Trae tu propia política: el modelo interpreta tu política escrita para poder generalizar entre productos con mínima ingeniería.

  • Decisiones razonadas: trazas de razonamiento opcionales para ayudar con la depuración y las auditorías (pensadas para desarrolladores y profesionales de seguridad, no para mostrarlas a usuarios finales).

  • Esfuerzo de razonamiento configurable: elige bajo / medio / alto para equilibrar latencia vs. profundidad.

  • Licencia: Apache 2.0 (ver Disponibilidad y licenciamiento más abajo).

gpt‑oss‑safeguard es una buena opción para el filtrado de entrada/salida para LLM, el etiquetado de contenido en línea y los flujos de trabajo de etiquetado por lotes o revisión offline. Para aplicaciones generales (chat, agentes, etc.), recomendamos los modelos base de gpt‑oss.

Puedes adaptar el esquema a tus necesidades. Consulta el OpenAI Cookbook para guías de prompting y ejemplos.

Variantes del modelo y dimensionamiento

ModeloUso previstoNotas
gpt‑oss‑safeguard‑120bProducción, razonamiento de seguridad de alta capacidad117B parámetros (≈5.1B activos). Diseñado para caber en una

sola GPU de 80 GB
(p. ej., NVIDIA H100; también se ejecuta en GPU con más memoria como AMD MI300X).
gpt‑oss‑safeguard‑20bMenor latencia / entornos con restricciones21B parámetros (≈3.6B activos).

Ambos modelos se afinan (fine‑tune) a partir de gpt‑oss sin cambios en la arquitectura. Usan la misma plantilla de chat que gpt‑oss; puedes mantener tu configuración actual. Un patrón de prompting recomendado es colocar tu política en un mensaje de desarrollador y el contenido a evaluar en un mensaje de usuario.

Soporte y comunidad

Los despliegues de pesos abiertos son autogestionados y de autoservicio. Aquí es donde obtener soporte:

  • Preguntas, discusión, consejos: Usa las páginas de modelos de Hugging Face para participar con la comunidad.

  • Bugs reproducibles en el código de inferencia de referencia de OpenAI: Abre un issue en el repo de GitHub de gpt-oss.

  • Problemas con un runtime de terceros (p. ej., vLLM, Ollama, llama.cpp): Usa el rastreador de issues, foros o proceso de soporte del proyecto correspondiente.

OpenAI no brinda asistencia, implementación práctica ni soporte de depuración para configuraciones, entornos o aplicaciones de pesos abiertos autohospedadas o alojadas por terceros.

Seguiremos iterando con la comunidad para mejorar las herramientas abiertas de seguridad, incluso a través de la ROOST Model Community (RMC). La RMC reúne a profesionales y a investigadores de seguridad para compartir mejores prácticas de implementación de modelos de IA open source en flujos de trabajo de seguridad, incluidos resultados de evaluación y feedback de los modelos. Visita el repo de GitHub de la RMC para conocer más sobre esta alianza y cómo participar.

Soporte y comunidad

Los despliegues de pesos abiertos son autogestionados y de autoservicio. Aquí es donde obtener soporte:

  • Preguntas, discusión, consejos: Usa las páginas de modelos de Hugging Face para participar con la comunidad.

  • Bugs reproducibles en el código de inferencia de referencia de OpenAI: Abre un issue en el repo de GitHub de gpt-oss.

  • Problemas con un runtime de terceros (p. ej., vLLM, Ollama, llama.cpp): Usa el rastreador de issues, foros o proceso de soporte del proyecto correspondiente.

OpenAI no brinda asistencia, implementación práctica ni soporte de depuración para configuraciones, entornos o aplicaciones de pesos abiertos autohospedadas o alojadas por terceros.

Privacidad y seguridad

Privacidad y datos

Estos modelos están diseñados para ejecutarse en infraestructura que tú controlas (on-premises o en tu nube o la de un partner de hosting). OpenAI no recibe ni procesa los datos que envías a estos modelos autohospedados, a menos que los compartas explícitamente con OpenAI o uses a uno de nuestros partners de hosting administrado.

Seguridad

Estos modelos pasaron por un entrenamiento y pruebas de seguridad exhaustivos. Para más detalles, consulta nuestra ficha del modelo y el informe técnico.

Reportar infracciones de contenido

Si crees que el contenido generado con modelos gpt‑oss infringe nuestras políticas, puedes reportarlo a través de nuestro formulario de Reportar contenido. Proporciona la mayor cantidad de detalles posible para ayudar a nuestro equipo a revisar tu envío.

Preguntas frecuentes

¿Estos modelos son gratuitos?

Los pesos del modelo gpt-oss se pueden descargar y usar gratis bajo la licencia Apache 2.0 y la política de uso de gpt-oss. Sin embargo, tú eres responsable de cualquier costo asociado con ejecutarlos — como cómputo, almacenamiento o tarifas de hosting de terceros. Los precios dependerán de la infraestructura o del proveedor que elijas.

¿Estos modelos son “open source”?

Usamos el término modelos abiertos o de pesos abiertos para indicar que los pesos entrenados están disponibles públicamente bajo la licencia permisiva Apache 2.0 y la política de uso de gpt-oss. Esto significa que puedes descargar los modelos, ejecutarlos en tu propia infraestructura o con frameworks de hosting compatibles, y personalizarlos o afinarlos (fine‑tune).

Los modelos abiertos les dan a desarrolladores y organizaciones mayor control y flexibilidad. Puedes elegir dónde alojar, adaptar los modelos a casos de uso específicos y beneficiarte de un licenciamiento que permite un uso, modificación y redistribución amplios. Aunque los pesos entrenados son abiertos, parte de la infraestructura o el tooling alrededor puede seguir siendo propietario de sus proveedores.

¿Puedo acceder a estos modelos a través de la API de OpenAI o ChatGPT?

No. Estos modelos no se sirven en la API de OpenAI y no aparecen en ChatGPT.

¿Puedo afinar (fine‑tune) los modelos?

Sí. Puedes afinarlos usando herramientas open source y la infraestructura que prefieras. No ofrecemos fine‑tuning a través de las APIs de OpenAI para estos modelos.

¿Los modelos de pesos abiertos son más baratos que usar la API?

Los costos varían según la infraestructura, la carga de trabajo y el enfoque operativo. El autohospedaje puede ser más barato en algunos casos, mientras que nuestra plataforma de API puede ser más eficiente al considerar hosting, mantenimiento y actualizaciones.

¿Qué funcionalidades admiten estos modelos?

Actualmente, estos modelos son modelos de razonamiento solo de texto. Los runtimes comunes admiten streaming, function calling y salidas estructuradas. Revisa la documentación de tu runtime para conocer las capacidades exactas.

¿En qué se diferencia esto de ModAPI?

Este es un modelo de razonamiento muy capaz que te permite traer tu propia política. Puede funcionar en conjunto con ModAPI, pero probablemente no sea un reemplazo para casos de uso de baja latencia.

¿Este artículo te fue útil?