La latencia de una solicitud de completado está influida principalmente por dos factores: el modelo y la cantidad de tokens generados. Lee nuestra documentación actualizada para obtener orientación sobre cómo mejorar la latencia.
Optimizar la latencia con modelos de la API de OpenAI
Conoce los factores que influyen en los tiempos de respuesta
Última actualización: 15 days ago
