Esta página foi traduzida automaticamente. Ver o artigo original em inglês.

Otimizar a latência com modelos da API da OpenAI

Saiba mais sobre os fatores que influenciam os tempos de resposta

Atualizado: yesterday

A latência de um pedido de conclusão é influenciada sobretudo por dois fatores: o modelo e o número de tokens gerados. Leia a nossa documentação atualizada para obter orientações sobre como melhorar as latências.

Otimizar a latência com modelos da API da OpenAI

Este artigo foi útil?