La latencia de una solicitud de finalización se ve influida principalmente por dos factores: el modelo y la cantidad de tokens generados. Lee nuestra documentación actualizada para obtener guía sobre cómo mejorar las latencias.
Optimizar la latencia con los modelos de la API de OpenAI
Conoce los factores que influyen en los tiempos de respuesta
Última actualización: 9 days ago
