OpenAI
Cette page a été traduite automatiquement. Afficher l’article original en anglais.

Optimiser la latence avec les modèles de l’API OpenAI

Découvrez les facteurs qui influencent le temps de réponse

Mise à jour : 7 days ago

La latence d’une requête de complétion est principalement influencée par deux facteurs : le modèle et le nombre de tokens générés. Veuillez consulter notre documentation mise à jour pour obtenir des conseils sur l’amélioration des latences.

Cet article vous a-t-il été utile?