La latencia de una solicitud de finalización se ve influida principalmente por dos factores: el modelo y el número de tokens generados. Lee nuestra documentación actualizada para obtener orientación sobre cómo mejorar las latencias.
Optimización de la latencia con los modelos de la API de OpenAI
Descubre los factores que influyen en los tiempos de respuesta
Actualización: 8 days ago
