OpenAI
Esta página se tradujo automáticamente. Ver el artículo original en inglés.

Preguntas frecuentes sobre Assistants API (v2)

Última actualización: 3 days ago

A partir del 11 de marzo de 2025, hemos publicado los componentes básicos de nuestra nueva plataforma de Agents. Para más detalles, consulta nuestros documentos de la API de Responses API, las herramientas, incluidas Web Search, File Search y Computer Use, y nuestro Agents SDK con Tracing. Con base en tus comentarios sobre la beta de Assistants API, hemos incorporado mejoras clave en Responses API. Cuando logremos la paridad total de funcionalidades, anunciaremos un plan de descontinuación de Assistants API más adelante este año, con una fecha objetivo de cierre en la primera mitad de 2026.

¿Qué es la Assistants API?

La Assistants API permite a los desarrolladores crear fácilmente asistentes de IA potentes dentro de sus apps. Esta API elimina la necesidad de administrar el historial de conversaciones y agrega acceso a herramientas alojadas por OpenAI como Code Interpreter y File Search. La API también admite llamadas a funciones mejoradas para herramientas de terceros.

¿Todavía puedo usar Assistants API v1 beta?

No. A partir del 18 de diciembre de 2024, los usuarios ya no tienen acceso a la versión v1 de la beta de Assistants API. Actualmente solo damos soporte a v2. Consulta esta guía de migración para convertir tus llamadas de la API de v1 a v2

¿Cómo accedo?

La Assistants API está disponible para cualquier persona con una cuenta de OpenAI API. También puedes empezar desde el Assistants Playground.

¿Qué es un Assistant?

Un assistant representa una IA creada con un propósito específico que usa los modelos de OpenAI y puede acceder a archivos, mantener threads persistentes y llamar herramientas.

¿Qué es un Thread?

Un thread es una sesión de conversación entre un assistant y un usuario. Los threads simplifican el desarrollo de aplicaciones al almacenar el historial de mensajes y truncarlo cuando la conversación se vuelve demasiado larga para la longitud de contexto del modelo.

¿Qué es la herramienta File Search?

La herramienta file_search implementa varias buenas prácticas de recuperación listas para usar para ayudarte a extraer los datos correctos de tus archivos y así complementar las respuestas del modelo. Para más información, lee nuestra documentación para desarrolladores.

De forma predeterminada, la herramienta file_search usa la siguiente configuración:

  • Tamaño de fragmento: 800 tokens

  • Superposición de fragmentos: 400 tokens

  • Modelo de embeddings: text-embedding-3-large a 256 dimensiones

  • Número máximo de fragmentos agregados al contexto: 20

¿Cuáles son las restricciones para subir archivos?

Las restricciones para subir un archivo son:

  • 512 MB por archivo

  • 5M tokens por archivo

  • 10k archivos por vector store

  • 1 vector store por assistant

  • 1 vector store por thread

El límite total de almacenamiento para cada proyecto dentro de una organización es de 100 GB.

¿Cuáles son las limitaciones de la herramienta File Search?

Tenemos algunas limitaciones conocidas para las que estamos trabajando en agregar soporte en los próximos meses:

  1. Actualmente no hay forma de modificar la configuración de fragmentación, embeddings o recuperación.

  2. No admitimos el análisis de imágenes dentro de documentos.

  3. No admitimos recuperaciones sobre formatos de archivo estructurados (como archivos .csv o .jsonl). Consulta los tipos de archivo compatibles.

¿Cuáles son los límites de velocidad para Assistants API?

Los límites de velocidad para Assistants API no están vinculados al nivel de uso y modelo. En su lugar, hay límites predeterminados por tipo de solicitud, con un par de excepciones:

  • GET: 1000 RPM

  • POST: 300 RPM

    • POST a /v1/threads/<thread_id>/runs: 200 RPM

    • POST a /v1/threads/runs: 200 RPM

  • DELETE: 300 solicitudes por minuto

¿Cómo se cobra Code Interpreter en la API?

Code Interpreter cuesta $0.03 / sesión. Si tu assistant llama a Code Interpreter simultáneamente en dos threads diferentes, se crearán dos sesiones de Code Interpreter (2 * $0.03). Cada sesión permanece activa de forma predeterminada durante una hora, lo que significa que solo pagarías este costo una vez si tu usuario sigue dando instrucciones a Code Interpreter en el mismo thread durante hasta una hora.

¿Cómo se cobra File Search en la API?

File Search cuesta $0.10/GB de almacenamiento de vector store por día (el primer GB de almacenamiento es gratis). El tamaño del vector store se basa en el tamaño resultante del vector store una vez que tu archivo se analiza, se fragmenta y se generan sus embeddings.

Cualquier vector store creado antes del 17 de abril de 2024 será gratuito hasta finales de 2024, después de lo cual:

  • Se cobrará a las tarifas actuales (actualmente $0.10/GB/día) si se ha usado al menos una vez en un Run creado después del 17 de abril de 2024.

  • Se eliminará si no se ha usado en un solo Run entre el 17 de abril de 2024 y el 31 de diciembre de 2024 — esto es para evitar que se te cobre por vector stores que pudiste haber creado antes de que se anunciara este cambio de precios, pero que nunca usaste.

¿Hay un límite de cuántos assistants puedo crear?

No hay límite de cuántos assistants puede crear una organización.

¿Hay streaming disponible en la API?

Sí, el streaming está disponible en Assistants API.

¿Está disponible el modo JSON en Assistants API?

Sí, el modo JSON está disponible en Assistants API mediante el parámetro response_format en los objetos Assistants o Run.

¿Assistants API también gestionará solicitudes para llamadas a funciones de terceros?

No. Aunque las llamadas a funciones permiten que el modelo seleccione herramientas y dé formato a las solicitudes para ellas, la ejecución de llamadas a herramientas de terceros no la gestiona OpenAI.

¿Cómo se maneja la información que envío a OpenAI?

Al igual que en el resto de nuestra plataforma, los datos y archivos que se envían a la OpenAI API nunca se usan para entrenar nuestros modelos y puedes eliminar tus datos cuando lo necesites. Los datos subidos a Assistants API se almacenan indefinidamente hasta que un usuario los elimine manualmente.

¿DALL-E está disponible mediante Assistants API?

Por el momento, DALL-E no está disponible.

¿Hay una interfaz de usuario para Assistants API?

Puedes probar el Playground de Assistants API. Asegúrate de estar en la vista de Assistants en la barra lateral izquierda y de usar un modelo compatible con las herramientas que quieras activar.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

¿Cuál es el límite de caracteres para las instrucciones del assistant en Assistants API?

Las instrucciones del sistema que usa el assistant tienen una longitud máxima de 256,000 caracteres.

Me aparece un error como “El servidor tuvo un error al procesar tu solicitud. ¡Lo sentimos! Puedes reintentar tu solicitud o contactarnos a través de nuestro centro de ayuda en help.openai.com si el error persiste. “ ¿Qué debo hacer?

Si te aparece este error, podría significar que tu prompt no está configurado correctamente. Si sigues reintentando la solicitud y falla, aquí tienes algunas cosas para probar:

  1. asegúrate de reestructurar tu prompt para tratar cualquier comando tipo función como una función

  2. agrega cualquier comando en tu prompt como una función en tools

¿Por qué mi herramienta File Search no funciona bien?

Al usar la herramienta File Search, recomendamos configurar max_prompt_tokens en no menos de 20,000. Para conversaciones más largas o múltiples interacciones con File Search, considera aumentar este límite a 50,000 o, idealmente, eliminar por completo los límites de max_prompt_tokens para obtener resultados de la más alta calidad. Lee más aquí.

¿Cómo puedo enviar comentarios?

Nos encantaría conocer tus comentarios en nuestro Foro de desarrolladores, a través del Centro de ayuda en help.openai.com, o en Twitter @OpenAIDevs.

¿Este artículo te fue útil?