OpenAI
Esta página foi traduzida automaticamente. Ver o artigo original em inglês.

FAQ da API Batch

endpoint da API Batch para processamento assíncrono em lote

Atualizado: 8 days ago

Como funciona a API Batch?

O endpoint da API Batch, conforme documentado aqui, permite aos utilizadores enviar pedidos para processamento assíncrono em lote. Processaremos estes pedidos no prazo de 24 horas. Os detalhes de cada pedido serão lidos a partir de um ficheiro carregado previamente, e as respostas serão escritas num ficheiro de saída. Pode consultar o objeto de lote para obter atualizações de estado e resultados.

Qual é o preço da API Batch?

Cada modelo será disponibilizado com 50% de desconto no custo face às APIs síncronas. Pode encontrar mais informações sobre os nossos preços da API.

Que modelos posso processar em lote?

A API Batch está amplamente disponível na maioria dos nossos modelos, mas não em todos. Consulte a documentação de referência dos modelos para garantir que o modelo que está a utilizar suporta a API Batch.

O que acontece se a API não concluir o meu pedido dentro do prazo prometido?

O nosso objetivo é concluir todos os pedidos no prazo de 24 horas. Se um lote expirar (ou seja, se não puder ser concluído dentro da janela de tempo do SLA), o trabalho restante é cancelado e qualquer trabalho já concluído é devolvido. Será cobrado aos programadores todo o trabalho concluído.

Qual é o limite de pedidos que posso processar em lote?

As APIs de embeddings têm um limite de 1 milhão de pedidos em fila de espera de cada vez.

Para todas as outras APIs, não há limite para o número de pedidos que pode processar em lote; no entanto, cada escalão de utilização tem um limite de taxa para processamento em lote associado. O seu limite de taxa para processamento em lote inclui o número máximo de tokens de entrada que tem em fila de espera de cada vez. Pode encontrar os seus limites de taxa aqui.

Posso alterar o tempo que demora a receber uma resposta da API Batch?

A nossa janela de tempo atualmente especificada é de 24 horas. Atualmente, não podemos alterar este período de tempo.

O streaming é suportado na API Batch?

Não, o streaming não é suportado na API Batch. Os pedidos em lote devolvem resultados através de ficheiros de saída, em vez de respostas transmitidas por streaming.

As imagens são suportadas na API Batch?

Sim, as imagens são suportadas na API Batch.

Recebi uma mensagem de erro «The URL provided for this request does not prefix-match the batch endpoint». O que devo fazer?

Se receber este erro, isso significa que o seu URL está formatado incorretamente para o endpoint da API Batch. Consulte a nossa documentação aqui para se certificar de que está a chamar o endpoint corretamente.

A utilização da API Batch conta para os meus outros limites de taxa?

Os limites de taxa da API Batch são completamente separados dos limites existentes.

O que acontece se um lote for cancelado?

Se um lote for cancelado manualmente, são devolvidos todos os resultados que já tiverem sido concluídos. Será cobrado aos programadores todo o trabalho concluído.

O que acontece se um lote expirar?

Se um lote expirar (ou seja, se não puder ser concluído dentro da janela de tempo do SLA), o trabalho restante é cancelado e qualquer trabalho já concluído é devolvido. Será cobrado aos programadores todo o trabalho concluído.

Que estados posso esperar em tarefas em lote?

A tarefa em lote pode ter qualquer um dos seguintes estados: Em validação, Falhou, Em curso, A finalizar, Concluída, Expirada, A cancelar e Cancelada. Se estiver a verificar valores de estado da API programaticamente, utilize os literais em minúsculas: validating, failed, in_progress, finalizing, completed, expired, cancelling e cancelled.

  • Em validação: A validação do ficheiro carregado está em curso antes de o lote poder começar.

  • Falhou: O ficheiro falhou o processo de validação.

  • Em curso: O ficheiro foi validado com êxito e o processo em lote está em curso.

  • A finalizar: A tarefa em lote foi concluída e os resultados estão a ser preparados.

  • Concluída: A tarefa em lote está concluída e os resultados estão prontos.

  • Expirada: Não foi possível concluir o lote dentro da janela de tempo do SLA.

  • A cancelar: O cancelamento da tarefa em lote foi iniciado.

  • Cancelada: A tarefa em lote foi cancelada.

Como posso verificar que tarefas em lote já criei?

Pode obter uma lista de todas as suas tarefas em lote através da chamada à API especificada aqui.

A retenção zero de dados é suportada neste endpoint?

Se tiver a retenção zero de dados ativada para a sua organização, tenha em atenção que a retenção zero de dados não se aplica à API Batch. As organizações ZDR podem criar tarefas em lote, mas os ficheiros de entrada de lotes, saídas, erros e artefactos intermédios são retidos de acordo com as políticas de retenção configuradas do Batch, do File Service e do Sediment.

Este artigo foi útil?