OpenAI
Cette page a été traduite automatiquement. Afficher l’article original en anglais.

Optimiser la latence avec les modèles de l’API OpenAI

Découvrez les facteurs qui influencent les temps de réponse

Dernière mise à jour : 13 days ago

La latence d’une requête de complétion est principalement influencée par deux facteurs : le modèle et le nombre de tokens générés. Veuillez consulter notre documentation mise à jour pour des recommandations pour réduire la latence.

Cet article vous a-t-il été utile ?