OpenAI
Esta página se tradujo automáticamente. Ver el artículo original en inglés.

¿Cuáles son las mejores prácticas para gestionar mis límites de velocidad en la API?

Recibo errores de límite de velocidad, pero creo que estoy por debajo de mi límite. ¿Qué está pasando?

Actualización: 13 days ago

Introducción a los límites de velocidad

Los límites de velocidad son restricciones que nuestra API impone sobre el número de veces que un usuario o cliente puede acceder a nuestros servicios dentro de un período de tiempo determinado.

Los límites de velocidad pueden cuantizarse, lo que significa que se aplican durante períodos de tiempo más cortos (p. ej., 60.000 solicitudes/minuto pueden aplicarse como 1.000 solicitudes/segundo). Enviar ráfagas cortas de solicitudes o contextos (prompts+max_completion_tokens) demasiado largos puede provocar errores de límite de velocidad, incluso cuando técnicamente estás por debajo del límite por minuto.

Mejores prácticas para evitar errores de límite de velocidad

Organización predeterminada

Si perteneces a varias organizaciones con distintos planes de facturación y niveles de uso, asegúrate de que tu organización predeterminada esté configurada como la organización adecuada para controlar qué organización se usa por defecto al realizar solicitudes con tus claves de API.

Retroceso exponencial

Incluye lógica de retroceso exponencial en tu código. Esto capturará y reintentará las solicitudes fallidas.

Límites de tokens

Reduce max_completion_tokens para que coincida con el tamaño de tus completions. Las necesidades de uso se estiman a partir de este valor, por lo que reducirlo disminuirá la probabilidad de que recibas inesperadamente un error de límite de velocidad. Por ejemplo, si tu prompt crea completions de unos 400 tokens, el valor de max_tokens debería ser de un tamaño similar.

Optimiza tus prompts. Puedes hacerlo acortando tus instrucciones, eliminando palabras adicionales y quitando ejemplos extra. Puede que necesites trabajar en tu prompt y probarlo después de estos cambios para asegurarte de que sigue funcionando bien. El beneficio añadido de un prompt más corto es un menor coste para ti. Si necesitas ayuda, dínoslo.

Nivel de uso

Si has aplicado estas mejores prácticas pero sigues teniendo errores de límite de velocidad, puedes aumentar tus límites de velocidad aumentando tu nivel de uso. Puedes ver tus límites de velocidad actuales, tu nivel de uso actual y cómo aumentar tu nivel/límites de uso en la sección Límites de la configuración de tu cuenta.

Más información

Consulta aquí nuestra documentación completa sobre niveles de uso y límites de velocidad aquí.

¿Te ha resultado útil este artículo?