Preguntas frecuentes sobre las entradas de imagen de ChatGPT

Tu guía para usar la nueva función de entrada de imágenes de ChatGPT, desde cómo utilizarla eficazmente hasta comprender sus limitaciones

¿Qué son las entradas de imagen y cómo funcionan en ChatGPT?

ChatGPT ahora cuenta con funciones de imagen para entender e interpretar las imágenes que añades a las conversaciones como entradas de imagen.

¿Cómo debo usar las entradas de imagen en las conversaciones?

Uso básico: sube una foto para empezar. Pregunta sobre objetos en imágenes, analiza documentos o explora contenido visual. Añade más imágenes en turnos posteriores para profundizar o cambiar la conversación. Vuelve cuando quieras con nuevas fotos.

Anotar imágenes: para llamar la atención sobre zonas concretas, plantéate usar una herramienta de marcado de edición de fotos en tu imagen antes de subirla. Esto guía a ChatGPT para que se centre en los elementos que consideras importantes.

¿Qué planes pueden usar entradas de imagen?

Plus y ChatGPT Enterprise. En la web móvil, también puedes adjuntar fotos antes de iniciar sesión.

¿Qué modelos pueden aceptar entradas de imagen?

Todos los modelos de ChatGPT pueden aceptar entradas de imagen.

¿En qué plataformas están disponibles las entradas de imagen?

En todas las plataformas, incluida la web (chatgpt.com) y móviles (iOS / Android).

¿Se usan mis imágenes para mejorar vuestros modelos?

Nuestro enfoque sobre el uso del contenido, incluidas las imágenes, sigue siendo el mismo para cada producto.

Consulta Cómo se usan tus datos para mejorar el rendimiento del modelo para entender mejor cómo puede usarse el contenido en ChatGPT para mejorar el rendimiento del modelo y las opciones que tienen los usuarios.

En ChatGPT Enterprise, no usamos contenido para entrenar nuestros modelos.

¿Cómo añado entradas de imagen en ChatGPT?

Toca el icono + en el área del prompt y selecciona Añadir fotos y archivos. También puedes arrastrar un archivo de imagen al área de texto o pegar una imagen copiada en el portapapeles.

¿Las entradas de imagen admiten vídeos?

No, no puede gestionar vídeos. Actualmente solo admite el procesamiento de imágenes estáticas.

¿Qué tipos de archivo se admiten?

PNG (.png), JPEG (.jpeg y .jpg) y GIF no animados (.gif).

¿Cuántas imágenes puedo subir a la vez?

El número de imágenes que puedes añadir a una conversación depende de varios factores, como el tamaño de las imágenes y la cantidad de texto que las acompaña. Como pauta general, si encuentras problemas, plantéate reducir la cantidad o el tamaño de las imágenes.

¿Cuál es el límite de tamaño por imagen?

20 MB.

¿Cómo gestionan las funciones de imagen las imágenes ambiguas o poco claras?

Si una imagen es ambigua o poco clara, el modelo hará todo lo posible por interpretarla. Sin embargo, los resultados pueden ser menos precisos.

¿Qué limitaciones deben conocer los usuarios al usar ChatGPT con entradas de imagen?

Si utilizas la nueva función de entrada de imagen de ChatGPT, es importante que conozcas estas limitaciones:

Médico: el modelo no es adecuado para interpretar imágenes médicas especializadas, como tomografías computarizadas, y no debe usarse para obtener asesoramiento médico.
Idiomas distintos del inglés: el modelo no funciona tan bien al gestionar imágenes con texto de alfabetos no latinos, como el japonés o el coreano.
Texto grande: amplía el texto dentro de la imagen para mejorar la legibilidad, pero evita recortar detalles importantes.
Rotación: el modelo puede malinterpretar texto o imágenes rotados o del revés.
Elementos visuales: el modelo puede tener dificultades para entender gráficos o texto cuando varían los colores o estilos, como líneas continuas, discontinuas o de puntos.
Espacial: el modelo tiene dificultades con tareas que requieren una localización espacial precisa, como identificar posiciones de ajedrez.
Precisión: el modelo puede generar descripciones o pies de foto incorrectos en determinados escenarios.
Forma: el modelo tiene dificultades con imágenes panorámicas y de ojo de pez.
Metadatos y cambio de tamaño: el modelo no procesa los nombres de archivo originales ni los metadatos, y las imágenes se redimensionan antes del análisis, lo que afecta a sus dimensiones originales.
Recuento: puede dar recuentos aproximados de los objetos en las imágenes.