OpenAI
Esta página foi traduzida automaticamente. Veja o artigo original em inglês.

Modelos com pesos abertos da OpenAI (gpt-oss)

Saiba mais sobre os modelos com pesos abertos da OpenAI (gpt-oss) e onde obter suporte

Atualizado: 13 hours ago

Observação: este artigo oferece uma visão geral de alto nível. Informações para configuração técnica podem ser encontradas no site do gpt-oss, no GitHub, no Hugging Face e nos OpenAI Cookbooks.

Visão geral

Apresentamos dois modelos de raciocínio com pesos abertos: gpt‑oss‑120b e gpt‑oss‑20b. Eles rodam na infraestrutura que você controla ou por meio de provedores de hospedagem.

Observação: estes modelos não são servidos pela API da OpenAI e não estão disponíveis no ChatGPT.

Por que pesos abertos

  • Escolha e controle: execute modelos on-premises ou na sua nuvem privada, mantenha a residência de dados e ajuste o desempenho às suas necessidades.

  • Personalização: faça ajuste fino ou adapte os modelos com suas ferramentas abertas preferidas.

Disponibilidade e licenciamento

  • Licença: a Apache 2.0 permite amplo uso, modificação e redistribuição, incluindo uso comercial (sujeito à nossa política de uso do gpt-oss).

  • Serviço: não disponível pela API da OpenAI, portanto preços de API e limites de taxa não se aplicam.

  • Compatibilidade: pode ser executado com stacks comuns de inferência aberta, como vLLM, Ollama, llama.cpp, e em ambientes de GPU na nuvem ou autogerenciados.

Primeiros passos

Para obter os pesos do modelo e recursos de apoio, você pode:

  • Visitar o site do gpt-oss para uma visão geral e links diretos.

  • Baixar os pesos da coleção do Hugging Face — um hub da comunidade onde você pode encontrar ambos os modelos, ver exemplos de uso e, opcionalmente, executar inferência diretamente pelos serviços do Hugging Face.

  • Acessar nosso repositório GitHub para código de inferência de referência.

  • Usar guias no OpenAI Cookbook para configuração com runtimes compatíveis como Ollama, vLLM e Transformers. O Cookbook também inclui instruções passo a passo para execução local, uso de runtimes comuns e, quando houver suporte, ajuste fino de modelos gpt‑oss.

gpt‑oss‑safeguard (prévia de pesquisa)

gpt‑oss‑safeguard é um par de modelos de raciocínio de segurança com pesos abertos criados sobre o gpt‑oss. Eles foram projetados para classificação de segurança baseada em políticas e tarefas relacionadas de confiança e segurança que você executa na infraestrutura que controla. Assim como outros modelos gpt‑oss, esses pesos não são servidos pela API da OpenAI nem pelo ChatGPT.

  • Modelos somente de texto com schemas de saída estruturada de referência (por exemplo, veredito de política, justificativa).

  • Traga sua própria política: o modelo interpreta sua política escrita para que possa generalizar entre produtos com engenharia mínima.

  • Decisões fundamentadas: rastros de raciocínio opcionais para ajudar na depuração e em auditorias (destinados a desenvolvedores e profissionais de segurança, não à exibição para usuários finais).

  • Esforço de raciocínio configurável: escolha baixo / médio / alto para equilibrar latência e profundidade.

  • Licença: Apache 2.0 (veja Disponibilidade e licenciamento abaixo).

gpt‑oss‑safeguard é uma boa opção para filtragem de entrada/saída em LLMs, rotulagem de conteúdo online e fluxos de trabalho offline de rotulagem ou revisão em lote. Para aplicações gerais (chat, agentes etc.), recomendamos os modelos principais gpt‑oss.

Você pode adaptar o schema às suas necessidades. Consulte o OpenAI Cookbook para guias sobre prompting e exemplos.

Variantes de modelo e dimensionamento

ModeloUso pretendidoObservações
gpt‑oss‑safeguard‑120bProdução, raciocínio de segurança de alta capacidade117B parâmetros (≈5,1B ativos). Projetado para caber em uma

única GPU de 80 GB
(por exemplo, NVIDIA H100; também roda em GPUs com mais memória, como AMD MI300X).
gpt‑oss‑safeguard‑20bMenor latência / ambientes restritos21B parâmetros (≈3,6B ativos).

Ambos os modelos são ajustados finamente a partir do gpt‑oss, sem alteração de arquitetura. Eles usam o mesmo template de chat do gpt‑oss; você pode manter sua configuração existente. Um padrão de prompting recomendado é colocar sua política em uma mensagem de desenvolvedor e o conteúdo a avaliar em uma mensagem de usuário.

Suporte e comunidade

Implantações com pesos abertos são autogerenciadas e contam com autoatendimento. Veja onde obter suporte:

  • Perguntas, discussão, dicas: use as páginas de modelos no Hugging Face para interagir com a comunidade.

  • Bugs reproduzíveis no código de inferência de referência da OpenAI: abra uma issue no repositório GitHub do gpt-oss.

  • Problemas com um runtime de terceiros (por exemplo, vLLM, Ollama, llama.cpp): use o rastreador de issues, os fóruns ou o processo de suporte do respectivo projeto.

A OpenAI não oferece assistência, implementação prática nem suporte de depuração para quaisquer configurações, ambientes ou aplicações com pesos abertos hospedados por conta própria ou por terceiros.

Continuaremos iterando com a comunidade para melhorar ferramentas abertas de segurança, inclusive por meio da ROOST Model Community (RMC). A RMC reúne profissionais e pesquisadores de segurança para compartilhar melhores práticas de implementação de modelos de AI de código aberto em fluxos de trabalho de segurança, incluindo resultados de avaliação e feedback sobre modelos. Visite o repositório GitHub da RMC para saber mais sobre esta parceria e como se envolver.

Suporte e comunidade

Implantações com pesos abertos são autogerenciadas e contam com autoatendimento. Veja onde obter suporte:

  • Perguntas, discussão, dicas: use as páginas de modelos no Hugging Face para interagir com a comunidade.

  • Bugs reproduzíveis no código de inferência de referência da OpenAI: abra uma issue no repositório GitHub do gpt-oss.

  • Problemas com um runtime de terceiros (por exemplo, vLLM, Ollama, llama.cpp): use o rastreador de issues, os fóruns ou o processo de suporte do respectivo projeto.

A OpenAI não oferece assistência, implementação prática nem suporte de depuração para quaisquer configurações, ambientes ou aplicações com pesos abertos hospedados por conta própria ou por terceiros.

Privacidade e segurança

Privacidade e dados

Esses modelos foram projetados para rodar na infraestrutura que você controla (on-premises, na sua nuvem ou em seu parceiro de hospedagem). A OpenAI não recebe nem processa os dados que você envia a esses modelos auto-hospedados, a menos que você os compartilhe explicitamente com a OpenAI ou use um de nossos parceiros de hospedagem gerenciada.

Segurança

Esses modelos passaram por treinamento e testes extensivos de segurança. Para mais detalhes, consulte nosso cartão do modelo e o relatório técnico.

Como denunciar violações de conteúdo

Se você acredita que conteúdo gerado com modelos gpt‑oss viola nossas políticas, pode denunciá-lo por meio do nosso formulário Denunciar conteúdo. Forneça o máximo de detalhes possível para ajudar nossa equipe a analisar seu envio.

Perguntas frequentes

Esses modelos são gratuitos?

Os pesos do modelo gpt-oss são gratuitos para baixar e usar sob a licença Apache 2.0 e a política de uso do gpt-oss. No entanto, você é responsável por quaisquer custos associados à execução deles — como computação, armazenamento ou taxas de hospedagem de terceiros. Os preços desses itens dependerão da infraestrutura ou do provedor escolhido.

Esses modelos são “open source”?

Usamos o termo modelos abertos ou pesos abertos para indicar que os pesos treinados estão disponíveis publicamente sob a licença permissiva Apache 2.0 e a política de uso do gpt-oss. Isso significa que você pode baixar os modelos, executá-los na sua própria infraestrutura ou com frameworks de hospedagem compatíveis, e personalizá-los ou ajustá-los finamente.

Modelos abertos dão a desenvolvedores e organizações maior controle e flexibilidade. Você pode escolher onde hospedar, adaptar os modelos para casos de uso específicos e se beneficiar de licenciamento que permite amplo uso, modificação e redistribuição. Embora os pesos treinados sejam abertos, parte da infraestrutura ou das ferramentas ao redor pode permanecer proprietária de seus provedores.

Posso acessar esses modelos pela API da OpenAI ou pelo ChatGPT?

Não. Esses modelos não são servidos na API da OpenAI e não aparecem no ChatGPT.

Posso fazer ajuste fino dos modelos?

Sim. Você pode fazer ajuste fino usando ferramentas de código aberto e sua infraestrutura preferida. Não oferecemos ajuste fino por meio das APIs da OpenAI para estes modelos.

Modelos com pesos abertos são mais baratos do que usar a API?

Os custos variam conforme a infraestrutura, a carga de trabalho e a abordagem operacional. A hospedagem própria pode ser mais barata em alguns casos, enquanto nossa Plataforma de API pode ser mais eficiente ao considerar hospedagem, manutenção e upgrades.

Quais recursos esses modelos aceitam?

Atualmente, esses modelos são modelos de raciocínio somente de texto. Runtimes comuns oferecem suporte a streaming, chamada de função e saídas estruturadas. Consulte a documentação do seu runtime para ver os recursos exatos.

Qual é a diferença em relação à ModAPI?

Este é um modelo de raciocínio altamente capaz que permite que você traga sua própria política. Ele pode trabalhar em conjunto com a ModAPI, mas provavelmente não substitui casos de uso de baixa latência.

Este artigo foi útil?