OpenAI
Esta página foi traduzida automaticamente. Ver o artigo original em inglês.

Modelos OpenAI de pesos abertos (gpt-oss)

Saiba mais sobre os modelos OpenAI de pesos abertos (gpt-oss) e onde obter suporte

Atualizado: 2 days ago

Nota: Este artigo fornece uma visão geral de alto nível. As informações para a configuração técnica podem ser encontradas no site do gpt-oss, no GitHub, no Hugging Face e nos Cookbooks da OpenAI.

Visão geral

Apresentamos dois modelos de raciocínio de pesos abertos: gpt‑oss‑120b e gpt‑oss‑20b. Funcionam em infraestrutura sob o seu controlo ou através de fornecedores de alojamento.

Nota: Estes modelos não são disponibilizados através da API da OpenAI e não estão disponíveis no ChatGPT.

Porquê pesos abertos

  • Escolha e controlo: Execute modelos nas suas instalações ou na sua cloud privada, mantenha a residência de dados e ajuste o desempenho às suas necessidades.

  • Personalização: Ajuste finamente ou adapte os modelos com as ferramentas abertas da sua preferência.

Disponibilidade e licenciamento

  • Licença: A Apache 2.0 permite utilização, modificação e redistribuição amplas, incluindo utilização comercial (sujeita à nossa política de utilização do gpt-oss).

  • Disponibilização: Não está disponível através da API da OpenAI, pelo que não se aplicam preços nem limites de taxa da API.

  • Compatibilidade: Pode ser executado com stacks comuns de inferência abertos, como vLLM, Ollama, llama.cpp, e em ambientes de GPU na cloud ou autogeridos.

Primeiros passos

Para obter os pesos do modelo e os recursos de apoio, pode:

  • Visitar o site do gpt-oss para uma visão geral e ligações diretas.

  • Transferir os pesos a partir da coleção Hugging Face — um centro da comunidade onde pode encontrar ambos os modelos, ver exemplos de utilização e, opcionalmente, executar inferência diretamente através dos serviços da Hugging Face.

  • Aceder ao nosso repositório GitHub para código de inferência de referência.

  • Utilizar os guias no OpenAI Cookbook para configuração com runtimes suportados como Ollama, vLLM e Transformers. O Cookbook também inclui instruções passo a passo para execução local, utilização de runtimes comuns e — quando suportado — ajuste fino dos modelos gpt‑oss.

gpt‑oss‑safeguard (pré-visualização de investigação)

gpt‑oss‑safeguard é um par de modelos de raciocínio de segurança de pesos abertos criados sobre o gpt‑oss. Foram concebidos para classificação de segurança baseada em políticas e tarefas relacionadas de trust & safety que executa em infraestrutura sob o seu controlo. Tal como outros modelos gpt‑oss, estes pesos não são disponibilizados através da API da OpenAI nem do ChatGPT.

  • Modelos apenas de texto com schemas de outputs estruturados de referência (por exemplo, veredito de política, fundamentação).

  • Traga a sua própria política: o modelo interpreta a sua política escrita para poder generalizar entre produtos com engenharia mínima.

  • Decisões fundamentadas: rastos de raciocínio opcionais para ajudar na depuração e em auditorias (destinados a programadores e profissionais de segurança, não para apresentação ao utilizador final).

  • Esforço de raciocínio configurável: escolha entre baixo / médio / alto para equilibrar latência vs. profundidade.

  • Licença: Apache 2.0 (consulte Disponibilidade e licenciamento abaixo).

gpt‑oss‑safeguard é uma boa opção para filtragem de entrada/saída para LLMs, rotulagem de conteúdo online e fluxos de trabalho de rotulagem ou revisão em lote offline. Para aplicações gerais (chat, agentes, etc.), recomendamos os modelos gpt‑oss principais.

Pode adaptar o schema às suas necessidades. Consulte o OpenAI Cookbook para guias sobre prompting e exemplos.

Variantes do modelo e dimensionamento

ModeloUtilização previstaNotas
gpt‑oss‑safeguard‑120bProdução, raciocínio de segurança de elevada capacidade117 mil milhões de parâmetros (≈5.1B ativos). Concebido para caber numa única GPU de 80 GB (por exemplo, NVIDIA H100; também funciona em GPUs com mais memória, como a AMD MI300X).
gpt‑oss‑safeguard‑20bAmbientes com menor latência / limitados21 mil milhões de parâmetros (≈3.6B ativos).

Ambos os modelos foram ajustados finamente a partir do gpt‑oss sem qualquer alteração de arquitetura. Utilizam o mesmo modelo de chat que o gpt‑oss; pode manter a sua configuração existente. Um padrão de prompting recomendado é colocar a sua política numa mensagem de programador e o conteúdo a avaliar numa mensagem de utilizador.

Suporte e comunidade

As implementações de pesos abertos são autogeridas e autoassistidas. Eis onde obter suporte:

  • Perguntas, discussão, dicas: Utilize as páginas de modelos da Hugging Face para interagir com a comunidade.

  • Erros reproduzíveis no código de inferência de referência da OpenAI: Abra um issue no repositório GitHub do gpt-oss.

  • Problemas com um runtime de terceiros (por exemplo, vLLM, Ollama, llama.cpp): Utilize o respetivo issue tracker, fóruns ou processo de suporte do projeto.

A OpenAI não fornece assistência, implementação prática nem suporte de depuração para quaisquer configurações, ambientes ou aplicações de pesos abertos autoalojados ou alojados por terceiros.

Continuaremos a iterar com a comunidade para melhorar as ferramentas abertas de segurança, incluindo através da ROOST Model Community (RMC). A RMC reúne profissionais e investigadores de segurança para partilhar boas práticas na implementação de modelos de IA open source em fluxos de trabalho de segurança, incluindo resultados de avaliação e feedback sobre modelos. Visite o repositório GitHub da RMC para saber mais sobre esta parceria e como participar.

Suporte e comunidade

As implementações de pesos abertos são autogeridas e autoassistidas. Eis onde obter suporte:

  • Perguntas, discussão, dicas: Utilize as páginas de modelos da Hugging Face para interagir com a comunidade.

  • Erros reproduzíveis no código de inferência de referência da OpenAI: Abra um issue no repositório GitHub do gpt-oss.

  • Problemas com um runtime de terceiros (por exemplo, vLLM, Ollama, llama.cpp): Utilize o respetivo issue tracker, fóruns ou processo de suporte do projeto.

A OpenAI não fornece assistência, implementação prática nem suporte de depuração para quaisquer configurações, ambientes ou aplicações de pesos abertos autoalojados ou alojados por terceiros.

Privacidade e segurança

Privacidade e dados

Estes modelos foram concebidos para funcionar em infraestrutura sob o seu controlo (nas suas instalações, na sua cloud ou com um parceiro de alojamento). A OpenAI não recebe nem processa os dados que envia para estes modelos autoalojados, exceto se os partilhar explicitamente com a OpenAI ou utilizar um dos nossos parceiros de alojamento gerido.

Segurança

Estes modelos foram sujeitos a treino e testes de segurança extensivos. Para mais detalhes, consulte a nossa ficha do modelo e o relatório técnico.

Comunicar violações de conteúdo

Se acredita que o conteúdo gerado com modelos gpt‑oss viola as nossas políticas, pode comunicá-lo através do nosso formulário Report Content. Forneça o máximo de detalhe possível para ajudar a nossa equipa a analisar a sua submissão.

FAQ

Estes modelos são gratuitos?

Os pesos do modelo gpt-oss podem ser transferidos e utilizados gratuitamente ao abrigo da licença Apache 2.0 e da política de utilização do gpt-oss. No entanto, é responsável por quaisquer custos associados à sua execução — como computação, armazenamento ou taxas de alojamento de terceiros. O preço desses elementos dependerá da infraestrutura ou do fornecedor escolhido.

Estes modelos são “open source”?

Utilizamos o termo modelos abertos ou pesos abertos para indicar que os pesos treinados estão disponíveis publicamente ao abrigo da licença permissiva Apache 2.0 e da política de utilização do gpt-oss. Isto significa que pode transferir os modelos, executá-los na sua própria infraestrutura ou com frameworks de alojamento suportados, e personalizá-los ou ajustá-los finamente.

Os modelos abertos dão aos programadores e às organizações maior controlo e flexibilidade. Pode escolher onde alojar, adaptar os modelos a casos de utilização específicos e beneficiar de licenciamento que permite utilização, modificação e redistribuição amplas. Embora os pesos treinados sejam abertos, alguma infraestrutura ou ferramentas circundantes podem continuar a ser proprietárias dos respetivos fornecedores.

Posso aceder a estes modelos através da API da OpenAI ou do ChatGPT?

Não. Estes modelos não são disponibilizados na API da OpenAI e não aparecem no ChatGPT.

Posso ajustar finamente os modelos?

Sim. Pode fazer ajuste fino com ferramentas open source e a infraestrutura da sua preferência. Não oferecemos ajuste fino através das APIs da OpenAI para estes modelos.

Os modelos de pesos abertos são mais baratos do que usar a API?

Os custos variam consoante a infraestrutura, a carga de trabalho e a abordagem operacional. O autoalojamento pode ser mais barato em alguns casos, enquanto a nossa API Platform pode ser mais eficiente ao considerar alojamento, manutenção e atualizações.

Que funcionalidades suportam estes modelos?

Atualmente, estes modelos são modelos de raciocínio apenas de texto. Os runtimes comuns suportam streaming, chamada de funções e outputs estruturados. Consulte a documentação do seu runtime para conhecer as capacidades exatas.

Em que é isto diferente da ModAPI?

Este é um modelo de raciocínio altamente capaz que lhe permite trazer a sua própria política. Pode funcionar em conjunto com a ModAPI, mas provavelmente não a substitui em casos de utilização de baixa latência.

Este artigo foi útil?