Preguntas frecuentes sobre entradas de imágenes en ChatGPT

Tu guía para navegar la nueva función de entrada de imágenes de ChatGPT, desde cómo usarla de forma efectiva hasta entender sus limitaciones

¿Qué son las entradas de imágenes y cómo funcionan en ChatGPT?

ChatGPT ahora tiene capacidades de imagen para comprender e interpretar las imágenes que agregues a las conversaciones como entradas de imágenes.

¿Cómo debería usar las entradas de imágenes en las conversaciones?

Uso básico: Sube una foto para empezar. Pregunta sobre objetos en las imágenes, analiza documentos o explora contenido visual. Agrega más imágenes en turnos posteriores para profundizar o cambiar el enfoque de la conversación. Vuelve cuando quieras con fotos nuevas.

Anotar imágenes: Para llamar la atención sobre áreas específicas, considera usar una herramienta de marcado/edición de fotos en tu imagen antes de subirla. Esto ayuda a que ChatGPT se enfoque en los elementos que consideres importantes.

¿Qué planes pueden usar entradas de imágenes?

Plus y ChatGPT Enterprise.

¿Qué modelos pueden aceptar entradas de imágenes?

Todos los modelos de ChatGPT pueden aceptar entradas de imágenes.

¿En qué plataformas están disponibles las entradas de imágenes?

En todas las plataformas, incluida la web (chatgpt.com) y móviles (iOS / Android).

¿Se usan mis imágenes para mejorar sus modelos?

Nuestro enfoque para usar el contenido, incluidas las imágenes, se mantiene igual para cada producto.

Consulta Cómo se usan tus datos para mejorar el desempeño del modelo para entender mejor cómo el contenido en ChatGPT puede usarse para mejorar el desempeño del modelo y las opciones que tienen los usuarios.

En ChatGPT Enterprise, no usamos el contenido para entrenar nuestros modelos.

¿Cómo agrego entradas de imágenes en ChatGPT?

Toca el ícono + en el área del prompt y selecciona Agregar fotos y archivos. Como alternativa, puedes arrastrar un archivo de imagen al área de texto o pegar una imagen copiada en tu portapapeles.

¿Las entradas de imágenes admiten videos?

No, no puede manejar videos. Actualmente solo admite el procesamiento de imágenes estáticas.

¿Qué tipos de archivos son compatibles?

PNG (.png), JPEG (.jpeg y .jpg) y GIF (.gif) no animado.

¿Cuántas imágenes puedo subir a la vez?

La cantidad de imágenes que puedes agregar a una conversación depende de varios factores, incluidos el tamaño de las imágenes y la cantidad de texto que las acompaña. Como guía general, si tienes problemas, considera reducir la cantidad de imágenes o su tamaño.

¿Cuál es el límite de tamaño por imagen?

20 MB.

¿Cómo manejan las capacidades de imagen las imágenes ambiguas o poco claras?

Si una imagen es ambigua o no está clara, el modelo hará lo posible por interpretarla. Sin embargo, los resultados pueden ser menos precisos.

¿Qué limitaciones deben tener en cuenta los usuarios al usar ChatGPT con entradas de imágenes?

Si estás usando la nueva función de entrada de imágenes de ChatGPT, es importante tener en cuenta estas limitaciones:

Medicina: El modelo no es adecuado para interpretar imágenes médicas especializadas como tomografías (CT) y no debe usarse para asesoramiento médico.
Idiomas distintos del inglés: El modelo no funciona tan bien al manejar imágenes con texto en alfabetos no latinos, como japonés o coreano.
Texto grande: Agranda el texto dentro de la imagen para mejorar la legibilidad, pero evita recortar detalles importantes.
Rotación: El modelo puede malinterpretar texto o imágenes giradas o al revés.
Elementos visuales: Al modelo puede costarle entender gráficos o texto donde varían colores o estilos como líneas continuas, discontinuas o punteadas.
Espacial: El modelo tiene dificultades con tareas que requieren una localización espacial precisa, como identificar posiciones de ajedrez.
Precisión: El modelo puede generar descripciones o pies de foto incorrectos en ciertos escenarios.
Forma: El modelo tiene dificultades con imágenes panorámicas y de ojo de pez.
Metadatos y cambio de tamaño: El modelo no procesa los nombres originales de los archivos ni los metadatos, y las imágenes se redimensionan antes del análisis, lo que afecta sus dimensiones originales.
Conteo: Puede dar conteos aproximados de objetos en las imágenes.