La latence d’une requête de complétion est principalement influencée par deux facteurs : le modèle et le nombre de tokens générés. Veuillez consulter notre documentation mise à jour pour des recommandations pour réduire la latence.
Optimiser la latence avec les modèles de l’API OpenAI
Découvrez les facteurs qui influencent les temps de réponse
Dernière mise à jour : 13 days ago
