Em 11 de março de 2025, lançamos os blocos de construção da nossa nova plataforma de Agents. Para mais detalhes, veja nossa documentação de API para a Responses API, as Tools, incluindo Web Search, File Search e Computer Use, além do nosso Agents SDK com Tracing. Com base no seu feedback sobre a beta da Assistants API, incorporamos melhorias importantes na Responses API. Depois que alcançarmos paridade total de recursos, anunciaremos um plano de descontinuação da Assistants API ainda este ano, com data-alvo de encerramento no primeiro semestre de 2026.
O que é a Assistants API?
A Assistants API permite que desenvolvedores criem facilmente assistentes de IA poderosos dentro de seus apps. Essa API elimina a necessidade de gerenciar o histórico de conversas e dá acesso a ferramentas hospedadas pela OpenAI, como o Code Interpreter e o File Search. A API também oferece suporte a chamadas de função aprimoradas para ferramentas de terceiros.
Ainda posso usar a Assistants API v1 beta?
Não. Desde 18 de dezembro de 2024, os usuários não têm mais acesso à versão v1 beta da Assistants API. No momento, oferecemos suporte apenas à v2. Consulte este guia de migração para converter suas chamadas de API da v1 para a v2
Como faço para acessar?
A Assistants API está disponível para qualquer pessoa com uma conta da OpenAI API. Você também pode começar pelo Assistants Playground.
O que é um Assistant?
Um assistant representa uma IA criada para um propósito específico que usa os modelos da OpenAI e pode acessar arquivos, manter threads persistentes e chamar ferramentas.
O que é uma Thread?
Uma thread é uma sessão de conversa entre um assistant e um usuário. Threads simplificam o desenvolvimento de aplicações ao armazenar o histórico de mensagens e truncá-lo quando a conversa fica longa demais para o tamanho de contexto do modelo.
O que é a ferramenta File Search?
A ferramenta file_search implementa, de forma nativa, diversas melhores práticas de recuperação (retrieval) para ajudar você a extrair os dados certos dos seus arquivos e aprimorar as respostas do modelo. Para mais informações, leia nossa documentação para desenvolvedores.
Por padrão, a ferramenta file_search usa as seguintes configurações:
Tamanho do chunk: 800 tokens
Sobreposição de chunk: 400 tokens
Modelo de embedding:
text-embedding-3-largecom 256 dimensõesNúmero máximo de chunks adicionados ao contexto: 20
Quais são as restrições para upload de arquivo?
As restrições para fazer upload de um arquivo são:
512 MB por arquivo
5M tokens por arquivo
10 mil arquivos por vector store
1 vector store por assistant
1 vector store por thread
O limite total de armazenamento para cada projeto em uma organização é de 100 GB.
Quais são as limitações da ferramenta File Search?
Temos algumas limitações conhecidas e estamos trabalhando para adicionar suporte a elas nos próximos meses:
No momento, não há como modificar as configurações de chunking, embedding ou retrieval.
Não oferecemos suporte ao parsing de imagens dentro de documentos.
Não oferecemos suporte a retrievals em formatos de arquivo estruturados (como arquivos .csv ou .jsonl). Consulte os tipos de arquivo suportados.
Quais são os limites de taxa (rate limits) da Assistants API?
Os limites de taxa da Assistants API não estão vinculados ao nível de uso e ao modelo. Em vez disso, há limites padrão por tipo de requisição, com algumas exceções:
GET: 1000 RPM
POST: 300 RPM
POST para
/v1/threads/<thread_id>/runs: 200 RPMPOST para
/v1/threads/runs: 200 RPM
DELETE: 300 requisições por minuto
Como o Code Interpreter é cobrado na API?
O Code Interpreter custa US$ 0,03 / sessão. Se o seu assistant chamar o Code Interpreter simultaneamente em duas threads diferentes, isso criará duas sessões do Code Interpreter (2 * US$ 0,03). Cada sessão fica ativa por padrão por uma hora, o que significa que você pagaria essa taxa apenas uma vez se seu usuário continuar enviando instruções ao Code Interpreter na mesma thread por até uma hora.
Como o File Search é cobrado na API?
O File Search custa US$ 0,10/GB por dia de armazenamento do vector store (o primeiro GB de armazenamento é gratuito). O tamanho do vector store é baseado no tamanho resultante do vector store depois que seu arquivo é parseado, dividido em chunks e transformado em embeddings.
Quaisquer vector stores criados antes de 17 de abril de 2024 serão gratuitos até o fim de 2024; depois disso, eles serão:
Cobrados pelas tarifas atuais (atualmente US$ 0,10/GB/dia) se tiverem sido usados ao menos uma vez em um Run criado após 17 de abril de 2024.
Excluídos se não tiverem sido usados em nenhum Run entre 17 de abril de 2024 e 31 de dezembro de 2024 — isso é para evitar que você seja cobrado por vector stores que talvez tenha criado antes de esse ajuste de preços ser anunciado, mas nunca tenha usado.
Existe um limite de quantos assistants posso criar?
Não há limite para quantos assistants uma organização pode criar.
O streaming está disponível na API?
Sim, o streaming está disponível na Assistants API.
O modo JSON está disponível na Assistants API?
Sim, o modo JSON está disponível na Assistants API pelo parâmetro response_format nos objetos Assistants ou Run.
A Assistants API também vai gerenciar requisições para chamadas de função de ferramentas de terceiros?
Não. Embora a chamada de função permita que o modelo selecione ferramentas e formate requisições para elas, a execução de chamadas para ferramentas de terceiros não é gerenciada pela OpenAI.
Como os dados que eu envio para a OpenAI são tratados?
Assim como no restante da nossa plataforma, dados e arquivos enviados para a OpenAI API nunca são usados para treinar nossos modelos e você pode excluir seus dados quando quiser. Os dados enviados para a Assistants API ficam armazenados por tempo indeterminado até que um usuário os exclua manualmente.
O DALL-E está disponível pela Assistants API?
No momento, o DALL-E não está disponível.
Existe uma UI para a Assistants API?
Você pode conferir o Playground da Assistants API. Certifique-se de estar na visualização Assistants na barra lateral esquerda e usando um modelo compatível com as ferramentas que você quer ativar.

Qual é o limite de caracteres para as instruções do assistant na Assistants API?
As instruções de sistema que o assistant usa têm um tamanho máximo de 256.000 caracteres.
Estou recebendo um erro como “O servidor teve um erro ao processar sua solicitação. Desculpe por isso! Você pode tentar novamente sua solicitação ou entrar em contato conosco pela nossa central de ajuda em help.openai.com se o erro persistir. “ O que devo fazer?
Se você estiver recebendo esse erro, pode ser que o seu prompt não esteja configurado corretamente. Se você continuar tentando a solicitação e ela falhar, aqui vão algumas coisas para tentar:
certifique-se de reestruturar seu prompt para tratar quaisquer comandos semelhantes a funções como funções
adicione quaisquer comandos no seu prompt como uma função em
tools
Por que minha ferramenta File Search não está funcionando bem?
Ao usar a ferramenta File Search, recomendamos definir max_prompt_tokens como no mínimo 20.000. Para conversas mais longas ou múltiplas interações com o File Search, considere aumentar esse limite para 50.000 ou, idealmente, remover completamente os limites de max_prompt_tokens para obter resultados da mais alta qualidade. Leia mais aqui.
Como posso enviar feedback?
Adoraríamos receber seu feedback no nosso Fórum de Desenvolvedores, pela Central de Ajuda em help.openai.com ou no Twitter @OpenAIDevs.
