OpenAI
Esta página se tradujo automáticamente. Ver el artículo original en inglés.

Preguntas frecuentes sobre Assistants API (v2)

Última actualización: 3 days ago

Desde el 11 de marzo de 2025, lanzamos los componentes básicos de nuestra nueva plataforma Agents. Para obtener detalles, consulta nuestra documentación de la API para nuestra Responses API, herramientas como Búsqueda web, Búsqueda de archivos y Uso de computadora, y nuestro SDK de Agents con rastreo. Según tus comentarios sobre la versión beta de Assistants API, incorporamos mejoras clave en la Responses API. Después de lograr la paridad completa de funciones, anunciaremos un plan de obsolescencia de Assistants API más adelante este año, con una fecha objetivo de desactivación en la primera mitad de 2026.

¿Qué es la Assistants API?

La Assistants API permite que los desarrolladores creen fácilmente asistentes de IA potentes dentro de sus apps. Esta API elimina la necesidad de administrar el historial de conversaciones y agrega acceso a herramientas alojadas por OpenAI, como el intérprete de código y Búsqueda de archivos. La API también admite una llamada a funciones mejorada para herramientas de terceros.

¿Puedo seguir usando Assistants API v1 beta?

No. A partir del 18 de diciembre de 2024, los usuarios ya no tienen acceso a la versión v1 de la versión beta de Assistant API. Actualmente solo admitimos v2. Consulta esta guía de migración para convertir tus llamadas a la API de v1 a v2

¿Cómo accedo a ella?

La Assistants API está disponible para cualquier persona con una cuenta de la API de OpenAI, pero está obsoleta y se eliminará en agosto de 2026. Para proyectos nuevos, usa la Responses API en su lugar. Si ya usas la Assistants API, planifica tu migración a la Responses API. Aún puedes acceder a asistentes existentes en Assistants Playground mientras la API siga disponible.

¿Qué es un asistente?

Un asistente representa una IA creada para un propósito específico que usa los modelos de OpenAI y puede acceder a archivos, mantener hilos persistentes y llamar herramientas.

¿Qué es un hilo?

Un hilo es una sesión de conversación entre un asistente y un usuario. Los hilos simplifican el desarrollo de aplicaciones al almacenar el historial de mensajes y truncarlo cuando la conversación se vuelve demasiado larga para la longitud de contexto del modelo.

¿Qué es la herramienta Búsqueda de archivos?

La herramienta `file_search` implementa varias prácticas recomendadas de recuperación de forma predeterminada para ayudarte a extraer los datos correctos de tus archivos y aumentar las respuestas del modelo. Para obtener más información, lee nuestra documentación para desarrolladores.

De forma predeterminada, la herramienta file_search usa la siguiente configuración:

  • Tamaño de fragmento: 800 tokens

  • Superposición de fragmentos: 400 tokens

  • Modelo de incrustación: `text-embedding-3-large` con 256 dimensiones

  • Cantidad máxima de fragmentos agregados al contexto: 20

¿Cuáles son las restricciones para subir archivos?

Las restricciones para subir un archivo son:

  • 512 MB por archivo

  • 5 M de tokens por archivo

  • 10 000 archivos por almacén vectorial

  • 1 almacén vectorial por asistente

  • 1 almacén vectorial por hilo

El límite general de almacenamiento para cada proyecto en una organización es de 100 GB.

¿Cuáles son las limitaciones de la herramienta Búsqueda de archivos?

Tenemos algunas limitaciones conocidas para las que estamos trabajando en agregar compatibilidad en los próximos meses:

  1. Actualmente no hay forma de modificar la configuración de fragmentación, incrustación o recuperación.

  2. No admitimos el análisis de imágenes dentro de documentos.

  3. No admitimos recuperaciones en formatos de archivo estructurados (como archivos .csv o .jsonl). Consulta los tipos de archivo admitidos.

¿Cuáles son los límites de solicitudes para la Assistants API?

Los límites de solicitudes para la Assistants API no están vinculados al nivel de uso y modelo. En cambio, hay límites predeterminados por tipo de solicitud, con un par de excepciones:

  • GET: 1000 RPM

  • POST: 300 RPM

  • DELETE: 300 solicitudes por minuto

¿Cómo se cobra el intérprete de código en la API?

El intérprete de código cuesta USD 0,03 por sesión. Si tu asistente llama al intérprete de código simultáneamente en dos hilos diferentes, esto creará dos sesiones del intérprete de código (2 * USD 0,03). Cada sesión está activa de forma predeterminada durante una hora, lo que significa que solo pagarías esta tarifa una vez si tu usuario sigue dando instrucciones al intérprete de código en el mismo hilo durante hasta una hora.

¿Cómo se cobra la Búsqueda de archivos en la API?

Búsqueda de archivos cuesta USD 0,10/GB de almacenamiento en almacén vectorial por día (el primer GB de almacenamiento es gratis). El tamaño del almacén vectorial se basa en el tamaño resultante del almacén vectorial una vez que tu archivo se analiza, fragmenta e incrusta.

Todos los almacenes vectoriales creados antes del 17 de abril de 2024 serán gratuitos hasta fines de 2024; después de eso, ocurrirá una de estas opciones:

  • Se facturarán según las tarifas vigentes (actualmente USD 0,10/GB/día) si se han usado al menos una vez en una Run creada después del 17 de abril de 2024.

  • Se eliminarán si no se han usado en una sola Run entre el 17 de abril de 2024 y el 31 de diciembre de 2024; esto es para evitar que se te cobre por almacenes vectoriales que quizá creaste antes de que se anunciara este cambio de precios, pero nunca usaste.

¿Hay un límite de cuántos asistentes puedo crear?

No hay límite de cuántos asistentes puede crear una organización.

¿La transmisión está disponible en la API?

Sí, la transmisión está disponible en la Assistants API.

¿El modo JSON está disponible en la Assistants API?

Sí, el modo JSON está disponible en la Assistants API mediante el parámetro response_format en los objetos Assistants o Run.

¿La Assistants API también administrará solicitudes para llamadas a funciones de terceros?

No. Aunque la llamada a funciones permite que el modelo seleccione herramientas y dé formato a las solicitudes para ellas, OpenAI no administra la ejecución de llamadas a herramientas de terceros.

¿Cómo se manejan los datos que envío a OpenAI?

Al igual que con el resto de nuestra plataforma, los datos y archivos que se pasan a la API de OpenAI nunca se usan para entrenar nuestros modelos y puedes eliminar tus datos cuando lo necesites. Los datos subidos a la Assistants API se almacenan indefinidamente hasta que un usuario los elimina manualmente.

¿DALL-E está disponible mediante la Assistants API?

Por el momento, DALL-E no está disponible.

¿Hay una interfaz de usuario para la Assistants API?

Puedes probar el Playground para la Assistants API. Asegúrate de estar en la vista Assistants en la barra lateral izquierda y de usar un modelo compatible con las herramientas que quieres activar.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

¿Cuál es el límite de caracteres para las instrucciones de asistente en la Assistants API?

El campo de instrucciones de asistente tiene una longitud máxima de 256 000 caracteres.

Recibo un error como “El servidor tuvo un error al procesar tu solicitud. ¡Lo sentimos! Puedes volver a intentar tu solicitud o contactarnos a través de nuestro centro de ayuda en help.openai.com si el error persiste. ” ¿Qué debo hacer?

Si recibes este error, podría significar que tu prompt no está configurado correctamente. Si sigues reintentando la solicitud y falla, estas son algunas cosas que puedes probar:

  1. asegúrate de reestructurar tu prompt para tratar cualquier comando similar a una función como una función

  2. agrega cualquier comando de tu prompt como una función a tools

¿Por qué mi herramienta Búsqueda de archivos no funciona bien?

Al usar la herramienta Búsqueda de archivos, recomendamos configurar max_prompt_tokens en no menos de 20 000. Para conversaciones más largas o múltiples interacciones con Búsqueda de archivos, considera aumentar este límite a 50 000 o, idealmente, eliminar por completo los límites de max_prompt_tokens para obtener resultados de la más alta calidad. Lee más aquí.

¿Cómo puedo enviar comentarios?

Nos encantaría recibir tus comentarios en nuestro Foro de desarrolladores, mediante el Centro de ayuda en help.openai.com o en Twitter @OpenAIDevs.

¿Este artículo te fue útil?