Saiba mais sobre os modelos OpenAI de pesos abertos (gpt-oss) e onde obter suporte

Nota: este artigo fornece uma visão geral de alto nível. Informações para a configuração técnica podem ser encontradas no site do gpt-oss, no GitHub, na Hugging Face e nos OpenAI Cookbooks.

Visão geral

Apresentamos dois modelos de raciocínio com pesos abertos: gpt‑oss‑120b e gpt‑oss‑20b. São executados em infraestrutura controlada por si ou através de fornecedores de alojamento.

Nota: Estes modelos não são disponibilizados através da API da OpenAI e não estão disponíveis no ChatGPT.

Porquê pesos abertos

Escolha e controlo: execute modelos on-premises ou na sua cloud privada, mantenha a residência de dados e ajuste o desempenho às suas necessidades.
Personalização: faça fine-tuning ou adapte os modelos com as suas ferramentas abertas preferidas.

Disponibilidade e licenciamento

Licença: a Apache 2.0 permite uma utilização, modificação e redistribuição amplas, incluindo utilização comercial (sujeita à nossa política de utilização do gpt-oss).
Disponibilização: não está disponível através da API da OpenAI, pelo que os preços da API e os limites de taxa não se aplicam.
Compatibilidade: pode ser executado com stacks de inferência aberta comuns, como vLLM, Ollama, llama.cpp, e em ambientes GPU na cloud ou autogeridos.

Introdução

Para obter os pesos do modelo e recursos de apoio, pode:

Visitar o site do gpt-oss para uma visão geral e ligações diretas.
Transferir pesos a partir da coleção da Hugging Face — um centro da comunidade onde pode encontrar ambos os modelos, ver exemplos de utilização e, opcionalmente, executar inferência diretamente através dos serviços da Hugging Face.
Aceder ao nosso repositório GitHub para código de inferência de referência.
Utilizar guias no OpenAI Cookbook para configuração com runtimes suportados, como Ollama, vLLM e Transformers. O Cookbook também inclui instruções passo a passo para execução local, utilização de runtimes comuns e, quando suportado, fine-tuning de modelos gpt‑oss.

gpt‑oss‑safeguard (pré-visualização de investigação)

gpt‑oss‑safeguard é um par de modelos de raciocínio de segurança com pesos abertos criados sobre o gpt‑oss. Foram concebidos para classificação de segurança baseada em políticas e tarefas relacionadas de confiança e segurança, executadas em infraestrutura controlada por si. Tal como outros modelos gpt‑oss, estes pesos não são disponibilizados através da API da OpenAI nem do ChatGPT.

Modelos apenas de texto com schemas de outputs estruturados de referência (por exemplo, veredito de política, fundamentação).
Traga a sua própria política: o modelo interpreta a sua política escrita para poder generalizar entre produtos com engenharia mínima.
Decisões fundamentadas: traços de raciocínio opcionais para ajudar na depuração e em auditorias (destinados a programadores e profissionais de segurança, não à apresentação a utilizadores finais).
Esforço de raciocínio configurável: escolha baixo / médio / alto para equilibrar latência e profundidade.
Licença: Apache 2.0 (consulte Disponibilidade e licenciamento abaixo).

gpt‑oss‑safeguard é adequado para filtragem de entradas/saídas para LLMs, etiquetagem de conteúdos online e fluxos de trabalho de etiquetagem ou revisão em lote offline. Para aplicações gerais (chat, agentes, etc.), recomendamos os modelos gpt‑oss principais.

Pode adaptar o schema às suas necessidades. Consulte o OpenAI Cookbook para guias sobre prompting e exemplos.

Variantes de modelos e dimensionamento

Modelo	Utilização prevista	Notas
gpt‑oss‑safeguard‑120b	Produção, raciocínio de segurança de alta capacidade	117 mil milhões de parâmetros (≈5,1 mil milhões ativos). Concebido para caber numa única GPU de 80 GB (por exemplo, NVIDIA H100; também é executado em GPUs com mais memória, como AMD MI300X).
gpt‑oss‑safeguard‑20b	Ambientes de menor latência / com restrições	21 mil milhões de parâmetros (≈3,6 mil milhões ativos).

Ambos os modelos são afinados a partir do gpt‑oss sem alteração da arquitetura. Utilizam o mesmo modelo de chat que o gpt‑oss; pode manter a sua configuração existente. Um padrão de prompting recomendado é colocar a sua política numa mensagem de programador e o conteúdo a avaliar numa mensagem de utilizador.

Suporte e comunidade

As implementações com pesos abertos são autogeridas e assistidas pelo próprio utilizador. Veja onde obter suporte:

Perguntas, discussão, sugestões: utilize as páginas de modelos da Hugging Face para interagir com a comunidade.
Erros reproduzíveis no código de inferência de referência da OpenAI: abra uma issue no repositório GitHub do gpt-oss.
Problemas com um runtime de terceiros (por exemplo, vLLM, Ollama, llama.cpp): utilize o respetivo sistema de issues, fóruns ou processo de suporte do projeto.

A OpenAI não fornece assistência, implementação prática nem suporte de depuração para quaisquer configurações, ambientes ou aplicações com pesos abertos autoalojados ou alojados por terceiros.

Continuaremos a iterar com a comunidade para melhorar as ferramentas abertas de segurança, incluindo através da ROOST Model Community (RMC). A RMC reúne profissionais e investigadores de segurança para partilhar melhores práticas de implementação de modelos de AI de código aberto em fluxos de trabalho de segurança, incluindo resultados de avaliação e feedback sobre modelos. Visite o repositório GitHub da RMC para saber mais sobre esta parceria e como participar.

Suporte e comunidade

As implementações com pesos abertos são autogeridas e assistidas pelo próprio utilizador. Veja onde obter suporte:

Perguntas, discussão, sugestões: utilize as páginas de modelos da Hugging Face para interagir com a comunidade.
Erros reproduzíveis no código de inferência de referência da OpenAI: abra uma issue no repositório GitHub do gpt-oss.
Problemas com um runtime de terceiros (por exemplo, vLLM, Ollama, llama.cpp): utilize o respetivo sistema de issues, fóruns ou processo de suporte do projeto.

Privacidade e segurança

Privacidade e dados

Estes modelos foram concebidos para serem executados em infraestrutura que controla (on-premises ou na sua cloud ou parceiro de alojamento). A OpenAI não recebe nem processa os dados que envia para estes modelos autoalojados, a menos que os partilhe explicitamente com a OpenAI ou utilize um dos nossos parceiros de alojamento gerido.

Segurança

Estes modelos foram submetidos a formação e testes de segurança extensivos. Para mais detalhes, consulte a nossa ficha do modelo e o relatório técnico.

Denunciar violações de conteúdo

Se acredita que conteúdo gerado com modelos gpt‑oss viola as nossas políticas, pode denunciá-lo através do nosso formulário Denunciar conteúdo. Forneça o máximo de detalhes possível para ajudar a nossa equipa a analisar a sua submissão.

FAQ

Estes modelos são gratuitos?

Os pesos dos modelos gpt-oss são gratuitos para transferir e utilizar ao abrigo da licença Apache 2.0 e da política de utilização do gpt-oss. No entanto, é responsável por quaisquer custos associados à sua execução — como computação, armazenamento ou taxas de alojamento de terceiros. Os preços desses serviços dependerão da infraestrutura ou do fornecedor que escolher.

Estes modelos são de “código aberto”?

Utilizamos o termo modelos abertos ou pesos abertos para indicar que os pesos treinados estão disponíveis publicamente ao abrigo da licença permissiva Apache 2.0 e da política de utilização do gpt-oss. Isto significa que pode transferir os modelos, executá-los na sua própria infraestrutura ou com frameworks de alojamento suportadas, e personalizá-los ou fazer fine-tuning.

Os modelos abertos dão aos programadores e às organizações maior controlo e flexibilidade. Pode escolher onde alojar, adaptar os modelos a casos de utilização específicos e beneficiar de licenciamento que permite uma utilização, modificação e redistribuição amplas. Embora os pesos treinados sejam abertos, alguma infraestrutura ou ferramentas envolventes podem permanecer proprietárias dos respetivos fornecedores.

Posso aceder a estes modelos através da API da OpenAI ou do ChatGPT?

Não. Estes modelos não são disponibilizados na API da OpenAI e não aparecem no ChatGPT.

Posso fazer fine-tuning dos modelos?

Sim. Pode fazer fine-tuning utilizando ferramentas de código aberto e a sua infraestrutura preferida. Não disponibilizamos fine-tuning através das APIs da OpenAI para estes modelos.

Os modelos com pesos abertos são mais baratos do que utilizar a API?

Os custos variam consoante a infraestrutura, a carga de trabalho e a abordagem operacional. O autoalojamento pode ser mais barato em alguns casos, enquanto a nossa Plataforma de API pode ser mais eficiente ao considerar alojamento, manutenção e atualizações.

Que funcionalidades suportam estes modelos?

Atualmente, estes modelos são modelos de raciocínio apenas de texto. Runtimes comuns suportam streaming, chamada de funções e outputs estruturados. Consulte a documentação do seu runtime para conhecer as capacidades exatas.

Em que difere isto da ModAPI?

Este é um modelo de raciocínio altamente capaz que lhe permite trazer a sua própria política. Pode funcionar em conjunto com a ModAPI, mas provavelmente não substitui casos de utilização de baixa latência.

Modelos OpenAI de pesos abertos (gpt-oss)

Visão geral

Porquê pesos abertos

Disponibilidade e licenciamento

Introdução

gpt‑oss‑safeguard (pré-visualização de investigação)

Variantes de modelos e dimensionamento

Suporte e comunidade

Suporte e comunidade

Privacidade e segurança

Privacidade e dados

Segurança

Denunciar violações de conteúdo

FAQ

Estes modelos são gratuitos?

Estes modelos são de “código aberto”?

Posso aceder a estes modelos através da API da OpenAI ou do ChatGPT?

Posso fazer fine-tuning dos modelos?

Os modelos com pesos abertos são mais baratos do que utilizar a API?

Que funcionalidades suportam estes modelos?

Em que difere isto da ModAPI?

Este artigo foi útil?