OpenAI
Esta página se tradujo automáticamente. Ver el artículo original en inglés.

Optimización de la latencia con los modelos de la API de OpenAI

Descubre los factores que influyen en los tiempos de respuesta

Actualización: 13 days ago

La latencia de una solicitud de finalización está influida principalmente por dos factores: el modelo y el número de tokens generados. Consulta nuestra documentación actualizada para obtener orientación sobre cómo mejorar la latencia.

¿Te ha resultado útil este artículo?