A latência de um pedido de conclusão é influenciada sobretudo por dois fatores: o modelo e o número de tokens gerados. Consulte a nossa documentação atualizada para obter orientações sobre como melhorar as latências.
Otimizar a latência com modelos da API da OpenAI
Saiba mais sobre os fatores que influenciam os tempos de resposta
Atualizado: 13 days ago
