Nota: este artigo fornece uma visão geral de alto nível. Informações para a configuração técnica podem ser encontradas no site do gpt-oss, no GitHub, na Hugging Face e nos OpenAI Cookbooks.
Visão geral
Apresentamos dois modelos de raciocínio com pesos abertos: gpt‑oss‑120b e gpt‑oss‑20b. São executados em infraestrutura controlada por si ou através de fornecedores de alojamento.
Nota: Estes modelos não são disponibilizados através da API da OpenAI e não estão disponíveis no ChatGPT.
Porquê pesos abertos
Escolha e controlo: execute modelos on-premises ou na sua cloud privada, mantenha a residência de dados e ajuste o desempenho às suas necessidades.
Personalização: faça fine-tuning ou adapte os modelos com as suas ferramentas abertas preferidas.
Disponibilidade e licenciamento
Licença: a Apache 2.0 permite uma utilização, modificação e redistribuição amplas, incluindo utilização comercial (sujeita à nossa política de utilização do gpt-oss).
Disponibilização: não está disponível através da API da OpenAI, pelo que os preços da API e os limites de taxa não se aplicam.
Compatibilidade: pode ser executado com stacks de inferência aberta comuns, como vLLM, Ollama, llama.cpp, e em ambientes GPU na cloud ou autogeridos.
Introdução
Para obter os pesos do modelo e recursos de apoio, pode:
Visitar o site do gpt-oss para uma visão geral e ligações diretas.
Transferir pesos a partir da coleção da Hugging Face — um centro da comunidade onde pode encontrar ambos os modelos, ver exemplos de utilização e, opcionalmente, executar inferência diretamente através dos serviços da Hugging Face.
Aceder ao nosso repositório GitHub para código de inferência de referência.
Utilizar guias no OpenAI Cookbook para configuração com runtimes suportados, como Ollama, vLLM e Transformers. O Cookbook também inclui instruções passo a passo para execução local, utilização de runtimes comuns e, quando suportado, fine-tuning de modelos gpt‑oss.
gpt‑oss‑safeguard (pré-visualização de investigação)
gpt‑oss‑safeguard é um par de modelos de raciocínio de segurança com pesos abertos criados sobre o gpt‑oss. Foram concebidos para classificação de segurança baseada em políticas e tarefas relacionadas de confiança e segurança, executadas em infraestrutura controlada por si. Tal como outros modelos gpt‑oss, estes pesos não são disponibilizados através da API da OpenAI nem do ChatGPT.
Modelos apenas de texto com schemas de outputs estruturados de referência (por exemplo, veredito de política, fundamentação).
Traga a sua própria política: o modelo interpreta a sua política escrita para poder generalizar entre produtos com engenharia mínima.
Decisões fundamentadas: traços de raciocínio opcionais para ajudar na depuração e em auditorias (destinados a programadores e profissionais de segurança, não à apresentação a utilizadores finais).
Esforço de raciocínio configurável: escolha baixo / médio / alto para equilibrar latência e profundidade.
Licença: Apache 2.0 (consulte Disponibilidade e licenciamento abaixo).
gpt‑oss‑safeguard é adequado para filtragem de entradas/saídas para LLMs, etiquetagem de conteúdos online e fluxos de trabalho de etiquetagem ou revisão em lote offline. Para aplicações gerais (chat, agentes, etc.), recomendamos os modelos gpt‑oss principais.
Pode adaptar o schema às suas necessidades. Consulte o OpenAI Cookbook para guias sobre prompting e exemplos.
Variantes de modelos e dimensionamento
| Modelo | Utilização prevista | Notas |
|---|---|---|
| gpt‑oss‑safeguard‑120b | Produção, raciocínio de segurança de alta capacidade | 117 mil milhões de parâmetros (≈5,1 mil milhões ativos). Concebido para caber numa única GPU de 80 GB (por exemplo, NVIDIA H100; também é executado em GPUs com mais memória, como AMD MI300X). |
| gpt‑oss‑safeguard‑20b | Ambientes de menor latência / com restrições | 21 mil milhões de parâmetros (≈3,6 mil milhões ativos). |
Ambos os modelos são afinados a partir do gpt‑oss sem alteração da arquitetura. Utilizam o mesmo modelo de chat que o gpt‑oss; pode manter a sua configuração existente. Um padrão de prompting recomendado é colocar a sua política numa mensagem de programador e o conteúdo a avaliar numa mensagem de utilizador.
Suporte e comunidade
As implementações com pesos abertos são autogeridas e assistidas pelo próprio utilizador. Veja onde obter suporte:
Perguntas, discussão, sugestões: utilize as páginas de modelos da Hugging Face para interagir com a comunidade.
Erros reproduzíveis no código de inferência de referência da OpenAI: abra uma issue no repositório GitHub do gpt-oss.
Problemas com um runtime de terceiros (por exemplo, vLLM, Ollama, llama.cpp): utilize o respetivo sistema de issues, fóruns ou processo de suporte do projeto.
A OpenAI não fornece assistência, implementação prática nem suporte de depuração para quaisquer configurações, ambientes ou aplicações com pesos abertos autoalojados ou alojados por terceiros.
Continuaremos a iterar com a comunidade para melhorar as ferramentas abertas de segurança, incluindo através da ROOST Model Community (RMC). A RMC reúne profissionais e investigadores de segurança para partilhar melhores práticas de implementação de modelos de AI de código aberto em fluxos de trabalho de segurança, incluindo resultados de avaliação e feedback sobre modelos. Visite o repositório GitHub da RMC para saber mais sobre esta parceria e como participar.
Suporte e comunidade
As implementações com pesos abertos são autogeridas e assistidas pelo próprio utilizador. Veja onde obter suporte:
Perguntas, discussão, sugestões: utilize as páginas de modelos da Hugging Face para interagir com a comunidade.
Erros reproduzíveis no código de inferência de referência da OpenAI: abra uma issue no repositório GitHub do gpt-oss.
Problemas com um runtime de terceiros (por exemplo, vLLM, Ollama, llama.cpp): utilize o respetivo sistema de issues, fóruns ou processo de suporte do projeto.
A OpenAI não fornece assistência, implementação prática nem suporte de depuração para quaisquer configurações, ambientes ou aplicações com pesos abertos autoalojados ou alojados por terceiros.
Privacidade e segurança
Privacidade e dados
Estes modelos foram concebidos para serem executados em infraestrutura que controla (on-premises ou na sua cloud ou parceiro de alojamento). A OpenAI não recebe nem processa os dados que envia para estes modelos autoalojados, a menos que os partilhe explicitamente com a OpenAI ou utilize um dos nossos parceiros de alojamento gerido.
Segurança
Estes modelos foram submetidos a formação e testes de segurança extensivos. Para mais detalhes, consulte a nossa ficha do modelo e o relatório técnico.
Denunciar violações de conteúdo
Se acredita que conteúdo gerado com modelos gpt‑oss viola as nossas políticas, pode denunciá-lo através do nosso formulário Denunciar conteúdo. Forneça o máximo de detalhes possível para ajudar a nossa equipa a analisar a sua submissão.
FAQ
Estes modelos são gratuitos?
Os pesos dos modelos gpt-oss são gratuitos para transferir e utilizar ao abrigo da licença Apache 2.0 e da política de utilização do gpt-oss. No entanto, é responsável por quaisquer custos associados à sua execução — como computação, armazenamento ou taxas de alojamento de terceiros. Os preços desses serviços dependerão da infraestrutura ou do fornecedor que escolher.
Estes modelos são de “código aberto”?
Utilizamos o termo modelos abertos ou pesos abertos para indicar que os pesos treinados estão disponíveis publicamente ao abrigo da licença permissiva Apache 2.0 e da política de utilização do gpt-oss. Isto significa que pode transferir os modelos, executá-los na sua própria infraestrutura ou com frameworks de alojamento suportadas, e personalizá-los ou fazer fine-tuning.
Os modelos abertos dão aos programadores e às organizações maior controlo e flexibilidade. Pode escolher onde alojar, adaptar os modelos a casos de utilização específicos e beneficiar de licenciamento que permite uma utilização, modificação e redistribuição amplas. Embora os pesos treinados sejam abertos, alguma infraestrutura ou ferramentas envolventes podem permanecer proprietárias dos respetivos fornecedores.
Posso aceder a estes modelos através da API da OpenAI ou do ChatGPT?
Não. Estes modelos não são disponibilizados na API da OpenAI e não aparecem no ChatGPT.
Posso fazer fine-tuning dos modelos?
Sim. Pode fazer fine-tuning utilizando ferramentas de código aberto e a sua infraestrutura preferida. Não disponibilizamos fine-tuning através das APIs da OpenAI para estes modelos.
Os modelos com pesos abertos são mais baratos do que utilizar a API?
Os custos variam consoante a infraestrutura, a carga de trabalho e a abordagem operacional. O autoalojamento pode ser mais barato em alguns casos, enquanto a nossa Plataforma de API pode ser mais eficiente ao considerar alojamento, manutenção e atualizações.
Que funcionalidades suportam estes modelos?
Atualmente, estes modelos são modelos de raciocínio apenas de texto. Runtimes comuns suportam streaming, chamada de funções e outputs estruturados. Consulte a documentação do seu runtime para conhecer as capacidades exatas.
Em que difere isto da ModAPI?
Este é um modelo de raciocínio altamente capaz que lhe permite trazer a sua própria política. Pode funcionar em conjunto com a ModAPI, mas provavelmente não substitui casos de utilização de baixa latência.
