La latencia de una solicitud de finalización está influida principalmente por dos factores: el modelo y el número de tokens generados. Consulta nuestra documentación actualizada para obtener orientación sobre cómo mejorar la latencia.
Optimización de la latencia con los modelos de la API de OpenAI
Descubre los factores que influyen en los tiempos de respuesta
Actualización: 13 days ago
