Nota: Este artigo fornece uma visão geral de alto nível. As informações para a configuração técnica podem ser encontradas no site do gpt-oss, no GitHub, no Hugging Face e nos Cookbooks da OpenAI.
Visão geral
Apresentamos dois modelos de raciocínio de pesos abertos: gpt‑oss‑120b e gpt‑oss‑20b. Funcionam em infraestrutura sob o seu controlo ou através de fornecedores de alojamento.
Nota: Estes modelos não são disponibilizados através da API da OpenAI e não estão disponíveis no ChatGPT.
Porquê pesos abertos
Escolha e controlo: Execute modelos nas suas instalações ou na sua cloud privada, mantenha a residência de dados e ajuste o desempenho às suas necessidades.
Personalização: Ajuste finamente ou adapte os modelos com as ferramentas abertas da sua preferência.
Disponibilidade e licenciamento
Licença: A Apache 2.0 permite utilização, modificação e redistribuição amplas, incluindo utilização comercial (sujeita à nossa política de utilização do gpt-oss).
Disponibilização: Não está disponível através da API da OpenAI, pelo que não se aplicam preços nem limites de taxa da API.
Compatibilidade: Pode ser executado com stacks comuns de inferência abertos, como vLLM, Ollama, llama.cpp, e em ambientes de GPU na cloud ou autogeridos.
Primeiros passos
Para obter os pesos do modelo e os recursos de apoio, pode:
Visitar o site do gpt-oss para uma visão geral e ligações diretas.
Transferir os pesos a partir da coleção Hugging Face — um centro da comunidade onde pode encontrar ambos os modelos, ver exemplos de utilização e, opcionalmente, executar inferência diretamente através dos serviços da Hugging Face.
Aceder ao nosso repositório GitHub para código de inferência de referência.
Utilizar os guias no OpenAI Cookbook para configuração com runtimes suportados como Ollama, vLLM e Transformers. O Cookbook também inclui instruções passo a passo para execução local, utilização de runtimes comuns e — quando suportado — ajuste fino dos modelos gpt‑oss.
gpt‑oss‑safeguard (pré-visualização de investigação)
gpt‑oss‑safeguard é um par de modelos de raciocínio de segurança de pesos abertos criados sobre o gpt‑oss. Foram concebidos para classificação de segurança baseada em políticas e tarefas relacionadas de trust & safety que executa em infraestrutura sob o seu controlo. Tal como outros modelos gpt‑oss, estes pesos não são disponibilizados através da API da OpenAI nem do ChatGPT.
Modelos apenas de texto com schemas de outputs estruturados de referência (por exemplo, veredito de política, fundamentação).
Traga a sua própria política: o modelo interpreta a sua política escrita para poder generalizar entre produtos com engenharia mínima.
Decisões fundamentadas: rastos de raciocínio opcionais para ajudar na depuração e em auditorias (destinados a programadores e profissionais de segurança, não para apresentação ao utilizador final).
Esforço de raciocínio configurável: escolha entre baixo / médio / alto para equilibrar latência vs. profundidade.
Licença: Apache 2.0 (consulte Disponibilidade e licenciamento abaixo).
gpt‑oss‑safeguard é uma boa opção para filtragem de entrada/saída para LLMs, rotulagem de conteúdo online e fluxos de trabalho de rotulagem ou revisão em lote offline. Para aplicações gerais (chat, agentes, etc.), recomendamos os modelos gpt‑oss principais.
Pode adaptar o schema às suas necessidades. Consulte o OpenAI Cookbook para guias sobre prompting e exemplos.
Variantes do modelo e dimensionamento
| Modelo | Utilização prevista | Notas |
| gpt‑oss‑safeguard‑120b | Produção, raciocínio de segurança de elevada capacidade | 117 mil milhões de parâmetros (≈5.1B ativos). Concebido para caber numa única GPU de 80 GB (por exemplo, NVIDIA H100; também funciona em GPUs com mais memória, como a AMD MI300X). |
| gpt‑oss‑safeguard‑20b | Ambientes com menor latência / limitados | 21 mil milhões de parâmetros (≈3.6B ativos). |
Ambos os modelos foram ajustados finamente a partir do gpt‑oss sem qualquer alteração de arquitetura. Utilizam o mesmo modelo de chat que o gpt‑oss; pode manter a sua configuração existente. Um padrão de prompting recomendado é colocar a sua política numa mensagem de programador e o conteúdo a avaliar numa mensagem de utilizador.
Suporte e comunidade
As implementações de pesos abertos são autogeridas e autoassistidas. Eis onde obter suporte:
Perguntas, discussão, dicas: Utilize as páginas de modelos da Hugging Face para interagir com a comunidade.
Erros reproduzíveis no código de inferência de referência da OpenAI: Abra um issue no repositório GitHub do gpt-oss.
Problemas com um runtime de terceiros (por exemplo, vLLM, Ollama, llama.cpp): Utilize o respetivo issue tracker, fóruns ou processo de suporte do projeto.
A OpenAI não fornece assistência, implementação prática nem suporte de depuração para quaisquer configurações, ambientes ou aplicações de pesos abertos autoalojados ou alojados por terceiros.
Continuaremos a iterar com a comunidade para melhorar as ferramentas abertas de segurança, incluindo através da ROOST Model Community (RMC). A RMC reúne profissionais e investigadores de segurança para partilhar boas práticas na implementação de modelos de IA open source em fluxos de trabalho de segurança, incluindo resultados de avaliação e feedback sobre modelos. Visite o repositório GitHub da RMC para saber mais sobre esta parceria e como participar.
Suporte e comunidade
As implementações de pesos abertos são autogeridas e autoassistidas. Eis onde obter suporte:
Perguntas, discussão, dicas: Utilize as páginas de modelos da Hugging Face para interagir com a comunidade.
Erros reproduzíveis no código de inferência de referência da OpenAI: Abra um issue no repositório GitHub do gpt-oss.
Problemas com um runtime de terceiros (por exemplo, vLLM, Ollama, llama.cpp): Utilize o respetivo issue tracker, fóruns ou processo de suporte do projeto.
A OpenAI não fornece assistência, implementação prática nem suporte de depuração para quaisquer configurações, ambientes ou aplicações de pesos abertos autoalojados ou alojados por terceiros.
Privacidade e segurança
Privacidade e dados
Estes modelos foram concebidos para funcionar em infraestrutura sob o seu controlo (nas suas instalações, na sua cloud ou com um parceiro de alojamento). A OpenAI não recebe nem processa os dados que envia para estes modelos autoalojados, exceto se os partilhar explicitamente com a OpenAI ou utilizar um dos nossos parceiros de alojamento gerido.
Segurança
Estes modelos foram sujeitos a treino e testes de segurança extensivos. Para mais detalhes, consulte a nossa ficha do modelo e o relatório técnico.
Comunicar violações de conteúdo
Se acredita que o conteúdo gerado com modelos gpt‑oss viola as nossas políticas, pode comunicá-lo através do nosso formulário Report Content. Forneça o máximo de detalhe possível para ajudar a nossa equipa a analisar a sua submissão.
FAQ
Estes modelos são gratuitos?
Os pesos do modelo gpt-oss podem ser transferidos e utilizados gratuitamente ao abrigo da licença Apache 2.0 e da política de utilização do gpt-oss. No entanto, é responsável por quaisquer custos associados à sua execução — como computação, armazenamento ou taxas de alojamento de terceiros. O preço desses elementos dependerá da infraestrutura ou do fornecedor escolhido.
Estes modelos são “open source”?
Utilizamos o termo modelos abertos ou pesos abertos para indicar que os pesos treinados estão disponíveis publicamente ao abrigo da licença permissiva Apache 2.0 e da política de utilização do gpt-oss. Isto significa que pode transferir os modelos, executá-los na sua própria infraestrutura ou com frameworks de alojamento suportados, e personalizá-los ou ajustá-los finamente.
Os modelos abertos dão aos programadores e às organizações maior controlo e flexibilidade. Pode escolher onde alojar, adaptar os modelos a casos de utilização específicos e beneficiar de licenciamento que permite utilização, modificação e redistribuição amplas. Embora os pesos treinados sejam abertos, alguma infraestrutura ou ferramentas circundantes podem continuar a ser proprietárias dos respetivos fornecedores.
Posso aceder a estes modelos através da API da OpenAI ou do ChatGPT?
Não. Estes modelos não são disponibilizados na API da OpenAI e não aparecem no ChatGPT.
Posso ajustar finamente os modelos?
Sim. Pode fazer ajuste fino com ferramentas open source e a infraestrutura da sua preferência. Não oferecemos ajuste fino através das APIs da OpenAI para estes modelos.
Os modelos de pesos abertos são mais baratos do que usar a API?
Os custos variam consoante a infraestrutura, a carga de trabalho e a abordagem operacional. O autoalojamento pode ser mais barato em alguns casos, enquanto a nossa API Platform pode ser mais eficiente ao considerar alojamento, manutenção e atualizações.
Que funcionalidades suportam estes modelos?
Atualmente, estes modelos são modelos de raciocínio apenas de texto. Os runtimes comuns suportam streaming, chamada de funções e outputs estruturados. Consulte a documentação do seu runtime para conhecer as capacidades exatas.
Em que é isto diferente da ModAPI?
Este é um modelo de raciocínio altamente capaz que lhe permite trazer a sua própria política. Pode funcionar em conjunto com a ModAPI, mas provavelmente não a substitui em casos de utilização de baixa latência.
