OpenAI
Esta página se tradujo automáticamente. Ver el artículo original en inglés.

¿Cuáles son las prácticas recomendadas para administrar mis límites de solicitudes en la API?

Recibo errores de límite de solicitudes, pero creo que estoy por debajo de mi límite. ¿Qué está pasando?

Última actualización: 13 days ago

Introducción a los límites de solicitudes

Los límites de solicitudes son restricciones que nuestra API impone sobre la cantidad de veces que un usuario o cliente puede acceder a nuestros servicios dentro de un periodo específico.

Los límites de solicitudes pueden cuantizarse, lo que significa que se aplican en periodos más cortos (p. ej., 60 000 solicitudes/minuto pueden aplicarse como 1000 solicitudes/segundo). Enviar ráfagas cortas de solicitudes o contextos (prompts+max_completion_tokens) demasiado largos puede generar errores de límite de solicitudes, incluso cuando técnicamente estás por debajo del límite de solicitudes por minuto.

Prácticas recomendadas para evitar errores de límite de solicitudes

Organización predeterminada

Si perteneces a varias organizaciones con distintos planes de facturación y niveles de uso, asegúrate de que tu organización predeterminada esté configurada como la organización adecuada para controlar qué organización se usa de forma predeterminada al hacer solicitudes con tus claves de API.

Retroceso exponencial

Incluye lógica de retroceso exponencial en tu código. Esto detectará las solicitudes con error y las reintentará.

Límites de tokens

Reduce max_completion_tokens para que coincida con el tamaño de tus completions. Las necesidades de uso se estiman a partir de este valor, por lo que reducirlo disminuirá la probabilidad de que recibas inesperadamente un error de límite de solicitudes. Por ejemplo, si tu prompt crea completions de alrededor de 400 tokens, el valor de max_tokens debe tener un tamaño similar.


Optimiza tus prompts. Puedes hacerlo acortando tus instrucciones, quitando palabras innecesarias y eliminando ejemplos adicionales. Quizás debas trabajar en tu prompt y probarlo después de estos cambios para asegurarte de que siga funcionando bien. El beneficio adicional de un prompt más corto es un menor costo para ti. Si necesitas ayuda, avísanos.

Nivel de uso

Si implementaste estas prácticas recomendadas, pero sigues recibiendo errores de límite de solicitudes, puedes aumentar tus límites de solicitudes aumentando tu nivel de uso. Puedes ver tus límites de solicitudes actuales, tu nivel de uso actual y cómo aumentar tu nivel de uso o tus límites en la sección Límites de la configuración de tu cuenta.

Lecturas adicionales

Revisa nuestra documentación completa sobre niveles de uso y límites de solicitudes aquí.

¿Este artículo te fue útil?