OpenAI
Esta página foi traduzida automaticamente. Ver o artigo original em inglês.

Modelos OpenAI de pesos abertos (gpt-oss)

Saiba mais sobre os modelos OpenAI de pesos abertos (gpt-oss) e onde obter suporte

Atualizado: 13 days ago

Nota: este artigo fornece uma visão geral de alto nível. Informações para a configuração técnica podem ser encontradas no site do gpt-oss, no GitHub, na Hugging Face e nos OpenAI Cookbooks.

Visão geral

Apresentamos dois modelos de raciocínio com pesos abertos: gpt‑oss‑120b e gpt‑oss‑20b. São executados em infraestrutura controlada por si ou através de fornecedores de alojamento.

Nota: Estes modelos não são disponibilizados através da API da OpenAI e não estão disponíveis no ChatGPT.

Porquê pesos abertos

  • Escolha e controlo: execute modelos on-premises ou na sua cloud privada, mantenha a residência de dados e ajuste o desempenho às suas necessidades.

  • Personalização: faça fine-tuning ou adapte os modelos com as suas ferramentas abertas preferidas.

Disponibilidade e licenciamento

  • Licença: a Apache 2.0 permite uma utilização, modificação e redistribuição amplas, incluindo utilização comercial (sujeita à nossa política de utilização do gpt-oss).

  • Disponibilização: não está disponível através da API da OpenAI, pelo que os preços da API e os limites de taxa não se aplicam.

  • Compatibilidade: pode ser executado com stacks de inferência aberta comuns, como vLLM, Ollama, llama.cpp, e em ambientes GPU na cloud ou autogeridos.

Introdução

Para obter os pesos do modelo e recursos de apoio, pode:

  • Visitar o site do gpt-oss para uma visão geral e ligações diretas.

  • Transferir pesos a partir da coleção da Hugging Face — um centro da comunidade onde pode encontrar ambos os modelos, ver exemplos de utilização e, opcionalmente, executar inferência diretamente através dos serviços da Hugging Face.

  • Aceder ao nosso repositório GitHub para código de inferência de referência.

  • Utilizar guias no OpenAI Cookbook para configuração com runtimes suportados, como Ollama, vLLM e Transformers. O Cookbook também inclui instruções passo a passo para execução local, utilização de runtimes comuns e, quando suportado, fine-tuning de modelos gpt‑oss.

gpt‑oss‑safeguard (pré-visualização de investigação)

gpt‑oss‑safeguard é um par de modelos de raciocínio de segurança com pesos abertos criados sobre o gpt‑oss. Foram concebidos para classificação de segurança baseada em políticas e tarefas relacionadas de confiança e segurança, executadas em infraestrutura controlada por si. Tal como outros modelos gpt‑oss, estes pesos não são disponibilizados através da API da OpenAI nem do ChatGPT.

  • Modelos apenas de texto com schemas de outputs estruturados de referência (por exemplo, veredito de política, fundamentação).

  • Traga a sua própria política: o modelo interpreta a sua política escrita para poder generalizar entre produtos com engenharia mínima.

  • Decisões fundamentadas: traços de raciocínio opcionais para ajudar na depuração e em auditorias (destinados a programadores e profissionais de segurança, não à apresentação a utilizadores finais).

  • Esforço de raciocínio configurável: escolha baixo / médio / alto para equilibrar latência e profundidade.

  • Licença: Apache 2.0 (consulte Disponibilidade e licenciamento abaixo).

gpt‑oss‑safeguard é adequado para filtragem de entradas/saídas para LLMs, etiquetagem de conteúdos online e fluxos de trabalho de etiquetagem ou revisão em lote offline. Para aplicações gerais (chat, agentes, etc.), recomendamos os modelos gpt‑oss principais.

Pode adaptar o schema às suas necessidades. Consulte o OpenAI Cookbook para guias sobre prompting e exemplos.

Variantes de modelos e dimensionamento

ModeloUtilização previstaNotas
gpt‑oss‑safeguard‑120bProdução, raciocínio de segurança de alta capacidade117 mil milhões de parâmetros (≈5,1 mil milhões ativos). Concebido para caber numa

única GPU de 80 GB
(por exemplo, NVIDIA H100; também é executado em GPUs com mais memória, como AMD MI300X).
gpt‑oss‑safeguard‑20bAmbientes de menor latência / com restrições21 mil milhões de parâmetros (≈3,6 mil milhões ativos).

Ambos os modelos são afinados a partir do gpt‑oss sem alteração da arquitetura. Utilizam o mesmo modelo de chat que o gpt‑oss; pode manter a sua configuração existente. Um padrão de prompting recomendado é colocar a sua política numa mensagem de programador e o conteúdo a avaliar numa mensagem de utilizador.

Suporte e comunidade

As implementações com pesos abertos são autogeridas e assistidas pelo próprio utilizador. Veja onde obter suporte:

  • Perguntas, discussão, sugestões: utilize as páginas de modelos da Hugging Face para interagir com a comunidade.

  • Erros reproduzíveis no código de inferência de referência da OpenAI: abra uma issue no repositório GitHub do gpt-oss.

  • Problemas com um runtime de terceiros (por exemplo, vLLM, Ollama, llama.cpp): utilize o respetivo sistema de issues, fóruns ou processo de suporte do projeto.

A OpenAI não fornece assistência, implementação prática nem suporte de depuração para quaisquer configurações, ambientes ou aplicações com pesos abertos autoalojados ou alojados por terceiros.

Continuaremos a iterar com a comunidade para melhorar as ferramentas abertas de segurança, incluindo através da ROOST Model Community (RMC). A RMC reúne profissionais e investigadores de segurança para partilhar melhores práticas de implementação de modelos de AI de código aberto em fluxos de trabalho de segurança, incluindo resultados de avaliação e feedback sobre modelos. Visite o repositório GitHub da RMC para saber mais sobre esta parceria e como participar.

Suporte e comunidade

As implementações com pesos abertos são autogeridas e assistidas pelo próprio utilizador. Veja onde obter suporte:

  • Perguntas, discussão, sugestões: utilize as páginas de modelos da Hugging Face para interagir com a comunidade.

  • Erros reproduzíveis no código de inferência de referência da OpenAI: abra uma issue no repositório GitHub do gpt-oss.

  • Problemas com um runtime de terceiros (por exemplo, vLLM, Ollama, llama.cpp): utilize o respetivo sistema de issues, fóruns ou processo de suporte do projeto.

A OpenAI não fornece assistência, implementação prática nem suporte de depuração para quaisquer configurações, ambientes ou aplicações com pesos abertos autoalojados ou alojados por terceiros.

Privacidade e segurança

Privacidade e dados

Estes modelos foram concebidos para serem executados em infraestrutura que controla (on-premises ou na sua cloud ou parceiro de alojamento). A OpenAI não recebe nem processa os dados que envia para estes modelos autoalojados, a menos que os partilhe explicitamente com a OpenAI ou utilize um dos nossos parceiros de alojamento gerido.

Segurança

Estes modelos foram submetidos a formação e testes de segurança extensivos. Para mais detalhes, consulte a nossa ficha do modelo e o relatório técnico.

Denunciar violações de conteúdo

Se acredita que conteúdo gerado com modelos gpt‑oss viola as nossas políticas, pode denunciá-lo através do nosso formulário Denunciar conteúdo. Forneça o máximo de detalhes possível para ajudar a nossa equipa a analisar a sua submissão.

FAQ

Estes modelos são gratuitos?

Os pesos dos modelos gpt-oss são gratuitos para transferir e utilizar ao abrigo da licença Apache 2.0 e da política de utilização do gpt-oss. No entanto, é responsável por quaisquer custos associados à sua execução — como computação, armazenamento ou taxas de alojamento de terceiros. Os preços desses serviços dependerão da infraestrutura ou do fornecedor que escolher.

Estes modelos são de “código aberto”?

Utilizamos o termo modelos abertos ou pesos abertos para indicar que os pesos treinados estão disponíveis publicamente ao abrigo da licença permissiva Apache 2.0 e da política de utilização do gpt-oss. Isto significa que pode transferir os modelos, executá-los na sua própria infraestrutura ou com frameworks de alojamento suportadas, e personalizá-los ou fazer fine-tuning.

Os modelos abertos dão aos programadores e às organizações maior controlo e flexibilidade. Pode escolher onde alojar, adaptar os modelos a casos de utilização específicos e beneficiar de licenciamento que permite uma utilização, modificação e redistribuição amplas. Embora os pesos treinados sejam abertos, alguma infraestrutura ou ferramentas envolventes podem permanecer proprietárias dos respetivos fornecedores.

Posso aceder a estes modelos através da API da OpenAI ou do ChatGPT?

Não. Estes modelos não são disponibilizados na API da OpenAI e não aparecem no ChatGPT.

Posso fazer fine-tuning dos modelos?

Sim. Pode fazer fine-tuning utilizando ferramentas de código aberto e a sua infraestrutura preferida. Não disponibilizamos fine-tuning através das APIs da OpenAI para estes modelos.

Os modelos com pesos abertos são mais baratos do que utilizar a API?

Os custos variam consoante a infraestrutura, a carga de trabalho e a abordagem operacional. O autoalojamento pode ser mais barato em alguns casos, enquanto a nossa Plataforma de API pode ser mais eficiente ao considerar alojamento, manutenção e atualizações.

Que funcionalidades suportam estes modelos?

Atualmente, estes modelos são modelos de raciocínio apenas de texto. Runtimes comuns suportam streaming, chamada de funções e outputs estruturados. Consulte a documentação do seu runtime para conhecer as capacidades exatas.

Em que difere isto da ModAPI?

Este é um modelo de raciocínio altamente capaz que lhe permite trazer a sua própria política. Pode funcionar em conjunto com a ModAPI, mas provavelmente não substitui casos de utilização de baixa latência.

Este artigo foi útil?