OpenAI
Cette page a été traduite automatiquement. Afficher l’article original en anglais.

FAQ sur les entrées d’images de ChatGPT

Votre guide pour vous repérer dans la nouvelle fonctionnalité d’entrée d’images de ChatGPT : de la façon de l’utiliser efficacement à la compréhension de ses limites

Dernière mise à jour : 14 days ago

Que sont les entrées d’images et comment fonctionnent-elles dans ChatGPT ?

ChatGPT dispose désormais de capacités d’analyse d’images pour comprendre et interpréter les images que vous ajoutez aux conversations en tant qu’entrées d’images.

Comment utiliser les entrées d’images dans les conversations ?

Utilisation de base : Importez une photo pour commencer. Posez des questions sur des objets présents dans des images, analysez des documents ou explorez du contenu visuel. Ajoutez d’autres images dans les échanges suivants pour approfondir ou faire évoluer la discussion. Revenez quand vous voulez avec de nouvelles photos.

Annoter les images : Pour attirer l’attention sur des zones précises, pensez à utiliser un outil de balisage/annotation (édition) sur votre image avant de l’importer. Cela aide ChatGPT à se concentrer sur les éléments que vous jugez importants.

Quels abonnements peuvent utiliser les entrées d’images ?

Plus et ChatGPT Enterprise.

Quels modèles peuvent accepter des entrées d’images ?

Tous les modèles ChatGPT peuvent accepter des entrées d’images.

Sur quelles plateformes les entrées d’images sont-elles disponibles ?

Toutes les plateformes, y compris le web (chatgpt.com) et le mobile (iOS / Android).

Mes images sont-elles utilisées pour améliorer vos modèles ?

Notre approche concernant l’utilisation du contenu, y compris les images, reste la même pour chaque produit.

Veuillez consulter Comment vos données sont utilisées pour améliorer les performances des modèles afin de mieux comprendre comment le contenu sur ChatGPT peut être utilisé pour améliorer les performances des modèles, ainsi que les choix dont disposent les utilisateurs.

Pour ChatGPT Enterprise, nous n’utilisons pas le contenu pour entraîner nos modèles.

Comment ajouter des entrées d’images dans ChatGPT ?

Appuyez sur l’icône + dans la zone de saisie et sélectionnez Ajouter des photos et des fichiers. Vous pouvez aussi faire glisser un fichier image dans la zone de texte ou coller une image copiée dans votre presse-papiers.

Les entrées d’images prennent-elles en charge les vidéos ?

Non, il ne peut pas gérer les vidéos. Il prend actuellement en charge le traitement des images statiques uniquement.

Quels types de fichiers sont pris en charge ?

PNG (.png), JPEG (.jpeg et .jpg) et GIF non animés (.gif).

Combien d’images puis-je importer à la fois ?

Le nombre d’images que vous pouvez ajouter à une conversation dépend de plusieurs facteurs, notamment la taille des images et la quantité de texte qui les accompagne. À titre indicatif, si vous rencontrez des problèmes, envisagez de réduire le nombre d’images ou leur taille.

Quelle est la limite de taille par image ?

20 Mo.

Comment les capacités d’analyse d’images gèrent-elles les images ambiguës ou peu claires ?

Si une image est ambiguë ou peu claire, le modèle fera de son mieux pour l’interpréter. Cependant, les résultats peuvent être moins précis.

Quelles limites les utilisateurs doivent-ils connaître lorsqu’ils utilisent ChatGPT avec des entrées d’images ?

Si vous utilisez la nouvelle fonctionnalité d’entrée d’images de ChatGPT, il est important de connaître ces limites :

  1. Médical : Le modèle n’est pas adapté à l’interprétation d’images médicales spécialisées comme les scanners (CT) et ne doit pas être utilisé pour des conseils médicaux.

  2. Langues autres que l’anglais : Le modèle est moins performant pour traiter des images contenant du texte dans des alphabets non latins, comme le japonais ou le coréen.

  3. Gros texte : Agrandissez le texte dans l’image pour améliorer la lisibilité, mais évitez de rogner des détails importants.

  4. Rotation : Le modèle peut mal interpréter du texte ou des images pivotés / à l’envers.

  5. Éléments visuels : Le modèle peut avoir du mal à comprendre des graphiques ou du texte lorsque des couleurs ou des styles, comme des lignes continues, en pointillés ou en pointillé, varient.

  6. Espace : Le modèle a du mal avec les tâches nécessitant une localisation spatiale précise, comme l’identification de positions aux échecs.

  7. Précision : Le modèle peut générer des descriptions ou des légendes incorrectes dans certains scénarios.

  8. Forme : Le modèle a du mal avec les images panoramiques et les images « fisheye » (grand-angle).

  9. Métadonnées et redimensionnement : Le modèle ne traite pas les noms de fichiers d’origine ni les métadonnées, et les images sont redimensionnées avant l’analyse, ce qui affecte leurs dimensions d’origine.

  10. Comptage : Peut donner des décomptes approximatifs des objets présents dans les images.

Cet article vous a-t-il été utile ?