OpenAI
Esta página se tradujo automáticamente. Ver el artículo original en inglés.

Optimización de la latencia con los modelos de la API de OpenAI

Descubre los factores que influyen en los tiempos de respuesta

Actualización: 8 days ago

La latencia de una solicitud de finalización se ve influida principalmente por dos factores: el modelo y el número de tokens generados. Lee nuestra documentación actualizada para obtener orientación sobre cómo mejorar las latencias.

¿Te ha resultado útil este artículo?