OpenAI
Esta página se tradujo automáticamente. Ver el artículo original en inglés.

Optimizar la latencia con modelos de la API de OpenAI

Conoce los factores que influyen en los tiempos de respuesta

Última actualización: 15 days ago

La latencia de una solicitud de completado está influida principalmente por dos factores: el modelo y la cantidad de tokens generados. Lee nuestra documentación actualizada para obtener orientación sobre cómo mejorar la latencia.

¿Este artículo te fue útil?