Preguntas frecuentes sobre recuperación visual con PDF

¿Qué es esta función?

ChatGPT Enterprise ahora permite leer y comprender elementos visuales (imágenes, gráficos, diagramas, etc.) incrustados en archivos PDF incluidos en prompts. Los usuarios pueden cargar un PDF, y ChatGPT puede interpretar el texto y cualquier elemento visual dentro de ese archivo.

¿Cómo funciona?

Haz clic en el ícono de clip (adjunto) en el chat para cargar tu PDF.
ChatGPT leerá tanto el texto como cualquier imagen o diagrama incrustado en el PDF.
Luego puedes hacer preguntas o solicitar resúmenes: desde extraer los puntos principales de un informe hasta explicar gráficos complejos.

¿Es compatible con GPTs y Proyectos?

Parcialmente. Los PDF cargados como Conocimiento de GPT o archivos de proyecto se procesan mediante recuperación solo de texto. Los PDF que cargan los usuarios durante interacciones con un GPT publicado o dentro de una conversación de proyecto se procesan mediante recuperación visual.

¿Quién puede usarla?

Esta capacidad está disponible solo para clientes de ChatGPT Enterprise. No es compatible con cuentas de ChatGPT Gratis, Pro, Team ni Edu.

¿Qué problema resuelve?

Antes, ChatGPT solo podía procesar imágenes cuando se cargaban por separado (p. ej., como PNG/JPEG). Las imágenes incrustadas en un PDF se pasaban por alto. Ahora, ChatGPT puede ofrecer un análisis más integral, al combinar el texto y las imágenes de una sola vez, lo que genera respuestas más precisas y con más contexto.

¿Esta función se extenderá eventualmente a otros planes?

Actualmente es exclusiva de Enterprise y podría ampliarse en el futuro. Estamos monitoreando los comentarios de los clientes para determinar cuándo y cómo ampliar la compatibilidad.