A latência de uma solicitação de completion é influenciada principalmente por dois fatores: o modelo e o número de tokens gerados. Leia nossa documentação atualizada para orientações sobre como melhorar a latência.
Otimizando a latência com modelos da API da OpenAI
Saiba quais fatores influenciam os tempos de resposta
Atualizado: 13 days ago
