La latence d’une requête de complétion est principalement influencée par deux facteurs : le modèle et le nombre de tokens générés. Veuillez consulter notre documentation mise à jour pour obtenir des conseils sur l’amélioration des latences.
Optimiser la latence avec les modèles de l’API OpenAI
Découvrez les facteurs qui influencent le temps de réponse
Mise à jour : 7 days ago
