OpenAI
Esta página foi traduzida automaticamente. Veja o artigo original em inglês.

Como otimizar a latência com modelos da API da OpenAI

Saiba mais sobre os fatores que influenciam os tempos de resposta

Atualizado: 9 days ago

A latência de uma solicitação de conclusão é influenciada principalmente por dois fatores: o modelo e o número de tokens gerados. Leia nossa documentação atualizada para obter orientações sobre como melhorar as latências.

Este artigo foi útil?