OpenAI
Cette page a été traduite automatiquement. Afficher l’article original en anglais.

Optimiser les téléversements de fichiers dans ChatGPT Enterprise

Comprenez comment les fonctions de ChatGPT Enterprise traitent les fichiers selon leur type, leur nombre et leur taille. Améliorez les résultats selon les exigences des fichiers.

Mise à jour : 20 days ago

ChatGPT Enterprise prend maintenant en charge la lecture et la compréhension des éléments visuels (images, graphiques, diagrammes, etc.) intégrés dans les fichiers PDF inclus dans les invites. Les utilisateurs peuvent téléverser un PDF, et ChatGPT peut interpréter le texte et tout élément visuel contenu dans ce fichier.

Pour en savoir plus, consultez la FAQ sur la récupération visuelle avec les PDF.

ChatGPT Enterprise vous permet de téléverser des fichiers de plusieurs façons :

Ce guide explique comment les fonctionnalités de ChatGPT Enterprise gèrent les fichiers selon leur type, leur nombre et leur taille, et présente des stratégies pour améliorer les résultats en fonction des exigences liées aux fichiers.

Résumé

ChatGPT Enterprise traite les différents types de fichiers de façon très différente : extraction de texte à partir de documents texte comme des PDF, des présentations et des fichiers Word, analyse de données structurées provenant de feuilles de calcul à l’aide de code Python, et description de fichiers image au moyen de GPT-Vision. Comprendre quel type de fichier déclenche quel flux de travail est essentiel pour obtenir le résultat attendu.

Pour les documents textuels, ChatGPT Enterprise inclut autant de texte pertinent que possible directement avec l’invite et utilise un système de recherche pour accéder à de l’information supplémentaire. Cela fonctionne bien pour répondre à des questions précises. Toutefois, cette approche peut éprouver des difficultés avec des tâches complexes, comme résumer de très grands documents ou comparer plusieurs fichiers volumineux. Poursuivez votre lecture pour comprendre les stratégies permettant d’améliorer vos résultats.

Gestion des fichiers selon leur type

ChatGPT Enterprise traite les fichiers de trois grandes façons : extraction de texte, analyse de code et interprétation d’images. Le type de fichier détermine le flux de travail suivi par ChatGPT Enterprise.

Récupération textuelleInterpréteur de codeTraitement d’imagesRécupération visuelle
Exemples de types de fichierspptx, docx, txt, md, json, xml, pdf*
* PDF téléversés comme

connaissances GPT
ou

fichiers de projet
csv, xls, xlsx*
* Remarque : l’interpréteur de code peut fonctionner avec n’importe quel type de fichier, mais ChatGPT Enterprise utilise le plus souvent l’IC par défaut pour les feuilles de calcul
jpg, pngpdf*
* PDF inclus dans les invites utilisateur
ComportementExtrait le texte du fichier – une partie du texte est collée (« insérée ») directement dans la fenêtre contextuelle; une autre partie est stockée pour la rechercheL’interpréteur de code transmet le fichier à Python pour le traitementLes images sont interprétées nativement par des modèles multimodaux, sous réserve des

limitations connues
.
Un hybride de récupération de texte et de traitement d’images. Le texte est extrait numériquement, et le contenu visuel est interprété nativement par des modèles multimodaux.

Pour les fichiers contenant uniquement du texte, les fichiers image ou les fichiers de données clairement structurés (p. ex., un tableau Excel de transactions), ces catégories représentent le meilleur comportement possible.

Il existe certaines zones grises moins évidentes, par exemple :

  • Les images intégrées dans des fichiers autres que des PDF ne sont pas traitées. Pour les inclure, convertissez le fichier en PDF avant le téléversement.

  • ChatGPT Enterprise utilisera toujours l’interpréteur de code pour interagir avec les feuilles de calcul, même si le document contient beaucoup de texte. Par exemple, si vous demandez à ChatGPT Enterprise de traduire un fichier CSV contenant 10 lignes de texte, il tentera de traduire le fichier au moyen d’une bibliothèque Python, ce qui est moins précis que de permettre au modèle de générer directement une traduction. Pour atténuer ce problème, essayez d’exporter la feuille de calcul dans un format textuel (PDF, par exemple).

  • De même, si vous téléversez un tableau transactionnel structuré contenu dans un fichier JSON, ChatGPT Enterprise interprétera ce fichier comme du texte brut. Si vous voulez analyser les données contenues dans un fichier JSON, indiquez au modèle d’utiliser l’interpréteur de code dans votre invite.

Gestion des fichiers selon leur taille

ChatGPT Enterprise utilise des modèles dotés d’une fenêtre contextuelle maximale de 128 k tokens (environ 200 pages de texte). Cependant, les tokens ne servent pas tous à intégrer le texte des fichiers téléversés. Le nombre de tokens « insérés » varie selon le type d’utilisation.

ChatGPT Enterprise « insère » une certaine quantité de texte, et le reste du texte est envoyé à un index de recherche privé (un « magasin de vecteurs », un type de base de données conçu pour stocker et récupérer efficacement de grandes quantités de texte). Lorsque vous posez une question, ChatGPT Enterprise intègre le texte inclus ainsi que les passages pertinents récupérés à partir d’un index de recherche privé.

Si vous téléversez un seul document, ChatGPT Enterprise inclut le texte à partir du début jusqu’à ce qu’il atteigne sa limite. Si vous téléversez plusieurs documents, ChatGPT Enterprise inclut une partie ou la totalité de chaque document. Tout le texte des documents est également envoyé à un index de recherche privé.

Remplissage contextuel pour les documents texte

Cette fonctionnalité est en cours de développement actif. Par conséquent, les détails suivants peuvent changer sans préavis.

ChatGPT Enterprise peut traiter jusqu’à 110 k tokens provenant de documents téléversés dans la fenêtre contextuelle. Si vous téléversez un ou plusieurs documents dont le total combiné est inférieur à 110 k tokens, tout le contenu sera inclus.

Pour un seul document dépassant 110 k tokens, seuls les 110 k premiers tokens seront inclus, à partir du début. Le reste sera seulement envoyé à l’index de recherche privé.

Si plusieurs documents sont téléversés et que leur total combiné dépasse 110 k tokens, ChatGPT Enterprise utilise un processus en deux étapes pour équilibrer la représentation des documents :

  1. Extraire jusqu’à 55 k tokens, répartis également entre les documents téléversés.

  1. Pour les documents qui ne sont pas entièrement représentés à la première étape, attribuer les 55 k tokens restants proportionnellement selon le nombre de tokens restants dans chaque document.

  1. Tous les tokens restants sont seulement envoyés à l’index de recherche privé.

Vous pouvez estimer le nombre de tokens dans un document texte en copiant le texte du document dans OpenAI Tokenizer.

Remplissage contextuel pour les PDF multimédias

Lorsque les utilisateurs téléversent des PDF contenant à la fois du texte et des images, la récupération visuelle permet à ChatGPT de traiter ces images nativement avec le texte extrait numériquement. Les étapes suivantes complètent nos procédures standard de gestion du contexte pour les PDF multimédias :

  • Extraction et intégration des images : les images sont extraites et intégrées avec le texte numérique qui leur est associé.

  • Mise à l’échelle intelligente : les images sont automatiquement mises à l’échelle afin de maintenir un équilibre entre la qualité de l’information et l’utilisation efficace de la fenêtre contextuelle disponible.

Lorsque les PDF téléversés dépassent la limite de 110 k tokens, les images et le texte sont tous deux intégrés dans l’index de recherche privé. Les intégrations de texte renvoient aux images pertinentes, ce qui permet à ChatGPT de récupérer les paires texte-image appropriées en fonction des requêtes des utilisateurs. Les images récupérées sont ensuite traitées à l’aide des capacités multimodales natives de ChatGPT.

Il est difficile d’estimer avec précision les besoins en tokens pour les PDF multimédias. Les tests suggèrent qu’environ 350 pages combinant texte et images utiliseront pleinement la fenêtre contextuelle de 110 k tokens.

Stratégies de recherche selon le type de modèle

Les modèles de série GPT et de série o prennent tous deux en charge le téléversement de fichiers et utilisent une logique identique de remplissage contextuel et d’intégration de recherche. Tous les modèles exécutent des recherches hybrides dans un index de recherche privé, en combinant des méthodes par mots-clés et des méthodes sémantiques. Dans une recherche hybride, le modèle génère une expression de recherche à partir de l’invite de l’utilisateur, et l’index de recherche privé récupère le texte et les images pertinents en conséquence.

Cependant, ces modèles diffèrent dans leur façon de rechercher dans de grands documents qui dépassent la fenêtre contextuelle :

Modèles de série GPT

  • Une seule recherche par invite : les modèles de série GPT effectuent une recherche par invite utilisateur.

  • Cas d’utilisation efficaces : idéal pour répondre à des questions simples intégrées dans une vaste documentation.

Exemples de requêtes :

  • « Quelle est la politique RH concernant la retraite anticipée? »

  • « Que fait la fonction process_order? »

Modèles de série o

  • Plusieurs recherches par invite : peut exécuter plusieurs recherches (généralement 2 ou 3) par invite utilisateur, chacune avec une expression de recherche unique. Les recherches sont exécutées de façon séquentielle, et le modèle peut ajuster son approche en fonction des renseignements récupérés lors des recherches précédentes.

  • Cas d’utilisation efficaces : plus adapté aux questions complexes nécessitant plusieurs recherches ciblées dans une vaste documentation.

Exemples de requêtes :

  • « Quelles sont les politiques RH concernant la retraite anticipée, le congé parental et les mutations à l’étranger? »

  • « Expliquez ce que fait la fonction process_order, dressez la liste de toutes les méthodes invoquées par cette fonction et décrivez brièvement chaque méthode invoquée. »

Malgré leurs forces, les modèles de série o peuvent éprouver des difficultés lorsqu’une requête nécessite plus de trois recherches.

Conseils pour améliorer les résultats de recherche de fichiers

  • Essayez d’utiliser un modèle de série o pour les questions complexes nécessitant plusieurs recherches.

  • N’oubliez pas que les réponses peuvent varier selon le type, le nombre et la taille des documents que vous téléversez.

  • En général, charger moins de documents, mais plus ciblés, mène à une meilleure exactitude.

  • Transformez les sujets comportant plusieurs questions en questions uniques :

    • Si vous devez connaître les politiques RH de chaque État, posez les questions une par une.

    • Si vous devez résumer de nombreux documents, demandez un document à la fois. Si ce document compte plusieurs centaines de pages, envisagez de le diviser en plus petits éléments.

      • Vous pourriez demander à ChatGPT Enterprise de rédiger un « résumé de résumés » si vous lui fournissez plusieurs résumés plutôt que des documents entiers.

    • Si vous avez un fichier CSV pour un appel d’offres (chaque ligne est une question différente), posez ces questions une par une au lieu de simplement charger le CSV et de demander une seule réponse.

  • Trouvez des façons de vérifier les réponses du modèle. Des exemples d’instructions GPT se trouvent ci-dessous :

# Contexte 

Vous êtes un expert en compréhension de documents. L’utilisateur va joindre un document et poser une question. Il doit être en mesure de rattacher votre réponse à la partie exacte du texte d’où vous avez tiré votre réponse.

# Instructions

1. Répondez à la question de l’utilisateur en vous basant sur son document joint, en utilisant exactement le format ci-dessous

# Format

- Question : { répéter la question de l’utilisateur }
- Réponse : { fournir une réponse à la question de l’utilisateur }
Source :
- - Numéro de section : { indiquer le numéro de section d’où vous avez tiré la réponse }
- - Titre de la section : { indiquer le titre de la section d’où vous avez tiré la réponse }
- - Texte exact : { fournir le texte exact d’où vous avez tiré la réponse }

# Règles

- Donnez des réponses claires et concises
- Fournissez seulement l’information présente dans le document
- Si vous ne trouvez pas la réponse dans le document, répondez simplement « Aucune information trouvée. »

Cet article vous a-t-il été utile?