FAQ da Assistants API (v2)

A 11 de março de 2025, lançámos os componentes básicos da nossa nova plataforma Agents. Para obter detalhes, consulte a nossa documentação da API para a Responses API, Ferramentas incluindo Web Search, File Search e Computer Use, bem como o nosso Agents SDK com Tracing. Com base no seu feedback sobre a Assistants API beta, incorporámos melhorias importantes na Responses API. Depois de alcançarmos paridade total de funcionalidades, anunciaremos um plano de descontinuação da Assistants API ainda este ano, com uma data prevista de encerramento no primeiro semestre de 2026.

O que é a Assistants API?

A Assistants API permite aos programadores criar facilmente assistentes de AI poderosos nas suas aplicações. Esta API elimina a necessidade de gerir o histórico de conversas e adiciona acesso a ferramentas alojadas pela OpenAI, como o Code Interpreter e o File Search. A API também suporta chamada de funções melhorada para ferramentas de terceiros.

Ainda posso utilizar a Assistants API v1 beta?

Não. A partir de 18 de dezembro de 2024, os utilizadores deixaram de ter acesso à versão v1 beta da Assistants API. Atualmente, só suportamos a v2. Consulte este guia de migração para converter as suas chamadas à API de v1 para v2

Como posso aceder-lhe?

A Assistants API está disponível para qualquer pessoa com uma conta da API da OpenAI, mas está obsoleta e será removida em agosto de 2026. Para novos projetos, utilize antes a Responses API. Se já utiliza a Assistants API, planeie a sua migração para a Responses API. Ainda pode aceder aos assistentes existentes no Assistants Playground enquanto a API continuar disponível.

O que é um Assistente?

Um assistente representa uma AI criada para um objetivo específico, que utiliza os modelos da OpenAI e pode aceder a ficheiros, manter threads persistentes e chamar ferramentas.

O que é uma Thread?

Uma thread é uma sessão de conversa entre um assistente e um utilizador. As threads simplificam o desenvolvimento de aplicações ao armazenarem o histórico de mensagens e truncá-lo quando a conversa fica demasiado longa para o comprimento de contexto do modelo.

O que é a ferramenta File Search?

A ferramenta `file_search` implementa de imediato várias práticas recomendadas de recuperação para ajudar a extrair os dados certos dos seus ficheiros e enriquecer as respostas do modelo. Para obter mais informações, leia a nossa documentação para programadores.

Por predefinição, a ferramenta file_search utiliza as seguintes definições:

Tamanho do fragmento: 800 tokens
Sobreposição de fragmentos: 400 tokens
Modelo de embeddings: `text-embedding-3-large` com 256 dimensões
Número máximo de fragmentos adicionados ao contexto: 20

Quais são as restrições para o carregamento de ficheiros?

As restrições para carregar um ficheiro são:

512 MB por ficheiro
5 M tokens por ficheiro
10 mil ficheiros por vector store
1 vector store por assistente
1 vector store por thread

O limite total de armazenamento de cada projeto numa organização é de 100 GB.

Quais são as limitações da ferramenta File Search?

Existem algumas limitações conhecidas para as quais estamos a trabalhar em suporte nos próximos meses:

Atualmente, não é possível modificar as definições de fragmentação, embeddings ou recuperação.
Não suportamos a análise de imagens dentro de documentos.
Não suportamos recuperações em formatos de ficheiro estruturados (como ficheiros .csv ou .jsonl). Consulte os tipos de ficheiro suportados.

Quais são os limites de taxa da Assistants API?

Os limites de taxa da Assistants API não estão associados ao escalão de utilização e ao modelo. Em vez disso, existem limites predefinidos por tipo de pedido, com algumas exceções:

GET: 1000 RPM
POST: 300 RPM

DELETE: 300 pedidos por minuto

Como é definido o preço do Code Interpreter na API?

O Code Interpreter tem o preço de $0.03 por sessão. Se o seu assistente invocar o Code Interpreter em simultâneo em duas threads diferentes, serão criadas duas sessões do Code Interpreter (2 * $0.03). Cada sessão fica ativa por predefinição durante uma hora, o que significa que só pagaria esta taxa uma vez se o seu utilizador continuasse a dar instruções ao Code Interpreter na mesma thread durante até uma hora.

Como é definido o preço do File Search na API?

O File Search tem o preço de $0.10/GB de armazenamento de vector store por dia (o primeiro GB de armazenamento é gratuito). O tamanho da vector store baseia-se no tamanho resultante da vector store depois de o seu ficheiro ser analisado, fragmentado e incorporado.

Todas as vector stores criadas antes de 17 de abril de 2024 serão gratuitas até ao final de 2024; depois disso, serão:

Cobradas às tarifas atuais (atualmente $0.10/GB/dia), se tiverem sido utilizadas pelo menos uma vez numa Run criada depois de 17 de abril de 2024.
Eliminadas se não tiverem sido utilizadas numa única Run entre 17 de abril de 2024 e 31 de dezembro de 2024 — isto serve para evitar que lhe sejam cobradas vector stores que possa ter criado antes de esta alteração de preços ser anunciada, mas que nunca utilizou.

Existe algum limite para o número de assistentes que posso criar?

Não existe limite para o número de assistentes que uma organização pode criar.

O streaming está disponível na API?

Sim, o streaming está disponível na Assistants API.

O modo JSON está disponível na Assistants API?

Sim, o modo JSON está disponível na Assistants API através do parâmetro response_format nos objetos Assistants ou Run.

A Assistants API também gere pedidos para chamadas de funções de terceiros?

Não. Embora a chamada de funções permita ao modelo selecionar ferramentas e formatar pedidos para elas, a execução de chamadas a ferramentas de terceiros não é gerida pela OpenAI.

Como são tratados os dados que envio para a OpenAI?

Tal como no resto da nossa plataforma, os dados e ficheiros enviados para a API da OpenAI nunca são utilizados para treinar os nossos modelos e pode eliminar os seus dados sempre que precisar. Os dados carregados para a Assistants API são armazenados indefinidamente até serem eliminados manualmente por um utilizador.

O DALL-E está disponível através da Assistants API?

Neste momento, o DALL-E não está disponível.

Existe uma IU para a Assistants API?

Pode experimentar o Playground da Assistants API. Certifique-se de que está na vista Assistants na barra lateral esquerda e de que utiliza um modelo compatível com as Ferramentas que pretende ativar.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

Qual é o limite de caracteres para as instruções do assistente na Assistants API?

O campo de instruções do assistente tem um comprimento máximo de 256 000 caracteres.

Estou a receber um erro como «O servidor encontrou um erro ao processar o seu pedido. Pedimos desculpa! Pode tentar novamente o pedido ou contactar-nos através do nosso Centro de Apoio em help.openai.com se o erro persistir. » O que devo fazer?

Se está a receber este erro, isso pode significar que o seu prompt não está configurado corretamente. Se continuar a repetir o pedido e este falhar, eis algumas coisas que pode experimentar:

certifique-se de que reestrutura o seu prompt para tratar quaisquer comandos semelhantes a funções como funções
adicione quaisquer comandos no seu prompt como uma função a tools

Porque é que a minha ferramenta File Search não está a funcionar bem?

Ao utilizar a ferramenta File Search, recomendamos definir max_prompt_tokens para, no mínimo, 20 000. Para conversas mais longas ou várias interações com o File Search, considere aumentar este limite para 50 000 ou, idealmente, remover por completo os limites de max_prompt_tokens para obter resultados da melhor qualidade. Leia mais aqui.

Como posso dar feedback?

Gostaríamos muito de receber o seu feedback no nosso Fórum de Programadores, através do Centro de Apoio em help.openai.com ou no Twitter @OpenAIDevs.