Cette page a été traduite automatiquement. Afficher l’article original en anglais.

Optimiser la latence avec les modèles de l’API OpenAI

Découvrez les facteurs qui influencent les temps de réponse

Dernière mise à jour : 9 days ago

La latence d’une requête de complétion est principalement influencée par deux facteurs : le modèle et le nombre de tokens générés. Veuillez consulter notre documentation mise à jour pour obtenir des conseils sur l’amélioration des latences.

Optimiser la latence avec les modèles de l’API OpenAI

Cet article vous a-t-il été utile ?