¿Qué es esta función?
ChatGPT Enterprise ahora admite leer y comprender elementos visuales (imágenes, gráficas, diagramas, etc.) integrados en archivos PDF incluidos en los prompts. Los usuarios pueden subir un PDF y ChatGPT puede interpretar el texto y cualquier elemento visual dentro de ese archivo.
¿Cómo funciona?
Haz clic en el ícono del clip (adjunto) en el chat para subir tu PDF.
ChatGPT leerá tanto el texto como cualquier imagen o diagrama integrado en el PDF.
Luego puedes hacer preguntas o solicitar resúmenes: desde extraer los puntos principales de un informe hasta explicar gráficas complejas.
¿Es compatible con los GPTs y los Proyectos?
Parcialmente. Los PDFs cargados como Conocimiento de GPT o como Archivos del Proyecto se procesan mediante recuperación solo de texto. Los PDFs que los usuarios suben durante interacciones con un GPT publicado o dentro de una conversación de Proyecto se procesan mediante recuperación visual.
¿Quién puede usarla?
Esta capacidad está disponible solo para clientes de ChatGPT Enterprise. No se admite para cuentas de ChatGPT Free, Pro, Team o Edu.
¿Qué problema resuelve?
Antes, ChatGPT solo podía procesar imágenes cuando se subían por separado (p. ej., como PNG/JPEG). Los elementos visuales integrados en un PDF se pasaban por alto. Ahora, ChatGPT puede ofrecer un análisis más integral, combinando el texto y los elementos visuales en una sola pasada, lo que permite respuestas más precisas y con mayor contexto.
¿Esta función eventualmente se extenderá a otros planes?
Actualmente es exclusiva de Enterprise y podría ampliarse en el futuro. Estamos monitoreando los comentarios de los clientes para determinar cuándo y cómo ampliar la compatibilidad.
