Perguntas frequentes da Assistants API (v2)

Em 11 de março de 2025, lançamos os blocos de construção da nossa nova plataforma de agentes. Para obter detalhes, consulte nossa documentação de API para a Responses API, ferramentas incluindo Web Search, File Search e Computer Use, e nosso Agents SDK com Tracing. Com base no seu feedback sobre a versão beta da Assistants API, incorporamos melhorias importantes à Responses API. Depois de alcançarmos paridade total de recursos, anunciaremos um plano de descontinuação da Assistants API ainda este ano, com data-alvo de encerramento no primeiro semestre de 2026.

O que é a Assistants API?

A Assistants API permite que desenvolvedores criem facilmente assistentes de AI poderosos em seus aplicativos. Essa API elimina a necessidade de gerenciar o histórico de conversas e adiciona acesso a ferramentas hospedadas pela OpenAI, como Code Interpreter e File Search. A API também oferece suporte a chamada de função aprimorada para ferramentas de terceiros.

Ainda posso usar a Assistants API v1 beta?

Não. A partir de 18 de dezembro de 2024, os usuários não têm mais acesso à versão v1 beta da Assistant API. Atualmente, oferecemos suporte apenas à v2. Consulte este guia de migração para converter suas chamadas de API de v1 para v2

Como faço para acessá-la?

A Assistants API está disponível para qualquer pessoa com uma conta da API da OpenAI, mas foi descontinuada e será removida em agosto de 2026. Para novos projetos, use a Responses API. Se você já usa a Assistants API, planeje sua migração para a Responses API. Você ainda pode acessar assistentes existentes no Assistants Playground enquanto a API permanecer disponível.

O que é um Assistente?

Um assistente representa uma AI criada para uma finalidade específica, que usa os modelos da OpenAI e pode acessar arquivos, manter threads persistentes e chamar ferramentas.

O que é uma Thread?

Uma thread é uma sessão de conversa entre um assistente e um usuário. As threads simplificam o desenvolvimento de aplicativos armazenando o histórico de mensagens e truncando-o quando a conversa fica longa demais para o tamanho de contexto do modelo.

O que é a ferramenta File Search?

A ferramenta `file_search` implementa várias práticas recomendadas de recuperação prontas para uso para ajudar você a extrair os dados certos dos seus arquivos e ampliar as respostas do modelo. Para mais informações, leia nossa documentação para desenvolvedores.

Por padrão, a ferramenta file_search usa as seguintes configurações:

Tamanho do chunk: 800 tokens
Sobreposição de chunks: 400 tokens
Modelo de embedding: `text-embedding-3-large` com 256 dimensões
Número máximo de chunks adicionados ao contexto: 20

Quais são as restrições para upload de arquivos?

As restrições para fazer upload de um arquivo são:

512 MB por arquivo
5 mi de tokens por arquivo
10 mil arquivos por vector store
1 vector store por assistente
1 vector store por thread

O limite total de armazenamento para cada projeto em uma organização é de 100 GB.

Quais são as limitações da ferramenta File Search?

Temos algumas limitações conhecidas para as quais estamos trabalhando para adicionar suporte nos próximos meses:

Atualmente, não há como modificar as configurações de divisão em chunks, embedding ou recuperação.
Não oferecemos suporte à análise de imagens dentro de documentos.
Não oferecemos suporte a recuperações em formatos de arquivo estruturados (como arquivos .csv ou .jsonl). Veja os tipos de arquivo compatíveis.

Quais são os limites de taxa da Assistants API?

Os limites de taxa da Assistants API não estão vinculados ao nível de uso e modelo. Em vez disso, há limites padrão por tipo de solicitação, com algumas exceções:

GET: 1000 RPM
POST: 300 RPM

DELETE: 300 solicitações por minuto

Qual é o preço do Code Interpreter na API?

O Code Interpreter custa US$ 0,03 por sessão. Se o seu assistente chamar o Code Interpreter simultaneamente em duas threads diferentes, isso criará duas sessões do Code Interpreter (2 * US$ 0,03). Cada sessão fica ativa por padrão por uma hora, o que significa que você só pagaria essa taxa uma vez se o usuário continuar dando instruções ao Code Interpreter na mesma thread por até uma hora.

Qual é o preço do File Search na API?

O File Search custa US$ 0,10/GB de armazenamento de vector store por dia (o primeiro GB de armazenamento é gratuito). O tamanho do vector store se baseia no tamanho resultante do vector store depois que o arquivo é analisado, dividido em chunks e convertido em embeddings.

Todos os vector stores criados antes de 17 de abril de 2024 serão gratuitos até o fim de 2024; depois disso, eles serão:

Cobrados pelas tarifas atuais (atualmente US$ 0,10/GB/dia) se tiverem sido usados pelo menos uma vez em uma Run criada após 17 de abril de 2024.
Excluídos se não tiverem sido usados em uma única Run entre 17 de abril de 2024 e 31 de dezembro de 2024 — isso é para evitar que você seja cobrado por vector stores que talvez tenha criado antes do anúncio dessa alteração de preços, mas nunca usou.

Há um limite para quantos assistentes posso criar?

Não há limite para quantos assistentes uma organização pode criar.

O streaming está disponível na API?

Sim, o streaming está disponível na Assistants API.

O modo JSON está disponível na Assistants API?

Sim, o modo JSON está disponível na Assistants API pelo parâmetro response_format nos objetos Assistants ou Run.

A Assistants API também gerencia solicitações para chamadas de função de terceiros?

Não. Embora a chamada de função permita que o modelo selecione ferramentas e formate solicitações para elas, a execução de chamadas para ferramentas de terceiros não é gerenciada pela OpenAI.

Como os dados que envio à OpenAI são tratados?

Como no restante da nossa plataforma, dados e arquivos enviados à API da OpenAI nunca são usados para treinar nossos modelos, e você pode excluir seus dados sempre que precisar. Os dados enviados para a Assistants API são armazenados indefinidamente até que um usuário os exclua manualmente.

O DALL-E está disponível pela Assistants API?

No momento, o DALL-E não está disponível.

Há uma interface para a Assistants API?

Você pode conferir o Playground da Assistants API. Verifique se você está na visualização Assistants na barra lateral esquerda e usando um modelo compatível com as Tools que deseja ativar.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

Qual é o limite de caracteres para instruções de assistente na Assistants API?

O campo de instruções do assistente tem comprimento máximo de 256.000 caracteres.

Estou recebendo um erro como “O servidor encontrou um erro ao processar sua solicitação. Desculpe por isso! Você pode tentar novamente sua solicitação ou entrar em contato conosco pela nossa Central de Ajuda em help.openai.com se o erro persistir. ” O que devo fazer?

Se você está recebendo esse erro, isso pode significar que seu prompt não está configurado corretamente. Se você continuar tentando a solicitação e ela falhar, veja algumas coisas para tentar:

certifique-se de reestruturar seu prompt para tratar quaisquer comandos semelhantes a funções como funções
adicione quaisquer comandos no seu prompt como uma função a tools

Por que minha ferramenta File Search não está funcionando bem?

Ao usar a ferramenta File Search, recomendamos definir max_prompt_tokens para no mínimo 20.000. Para conversas mais longas ou várias interações com o File Search, considere aumentar esse limite para 50.000 ou, idealmente, remover totalmente os limites de max_prompt_tokens para obter resultados da mais alta qualidade. Leia mais aqui.

Como posso enviar feedback?

Adoraríamos receber seu feedback em nosso Fórum de Desenvolvedores, pela Central de Ajuda em help.openai.com ou no Twitter @OpenAIDevs.