OpenAI
Esta página foi traduzida automaticamente. Veja o artigo original em inglês.

Otimizando a latência com modelos da API da OpenAI

Saiba quais fatores influenciam os tempos de resposta

Atualizado: 13 days ago

A latência de uma solicitação de completion é influenciada principalmente por dois fatores: o modelo e o número de tokens gerados. Leia nossa documentação atualizada para orientações sobre como melhorar a latência.

Este artigo foi útil?