FAQ zu visuellem Retrieval mit PDFs

Was ist diese Funktion?

ChatGPT Enterprise kann jetzt visuelle Inhalte (Bilder, Grafiken, Diagramme usw.) lesen und verstehen, die in per Prompt bereitgestellten PDF-Dateien eingebettet sind. Nutzer:innen können ein PDF hochladen, und ChatGPT kann den Text und alle visuellen Elemente in dieser Datei interpretieren.

Wie funktioniert das?

Klicke im Chat auf das Büroklammer-Symbol (Anhang), um dein PDF hochzuladen.
ChatGPT liest sowohl den Text als auch alle eingebetteten Bilder oder Diagramme im PDF.
Anschließend kannst du Fragen stellen oder Zusammenfassungen anfordern – vom Herausarbeiten der wichtigsten Punkte eines Berichts bis zur Erklärung komplexer Diagramme.

Ist die Funktion mit GPTs und Projekten kompatibel?

Teilweise. PDFs, die als GPT-Wissen oder Projektdateien hochgeladen wurden, werden per rein textbasiertem Retrieval verarbeitet. PDFs, die Nutzer:innen während der Interaktion mit einem veröffentlichten GPT oder innerhalb einer Projektunterhaltung hochladen, werden per visuellem Retrieval verarbeitet.

Wer kann die Funktion nutzen?

Diese Funktion ist nur für ChatGPT Enterprise-Kund:innen verfügbar. Sie wird für ChatGPT Free-, Pro-, Team- oder Edu-Konten nicht unterstützt.

Welches Problem löst die Funktion?

Bisher konnte ChatGPT Bilder nur verarbeiten, wenn sie separat hochgeladen wurden (z. B. als PNGs/JPEGs). In PDFs eingebettete visuelle Inhalte wurden nicht berücksichtigt. Jetzt kann ChatGPT eine ganzheitlichere Analyse liefern – Text und visuelle Inhalte werden in einem Durchgang kombiniert. Das führt zu präziseren Antworten mit mehr Kontext.

Wird diese Funktion später auf andere Tarife ausgeweitet?

Derzeit ist sie Enterprise vorbehalten und wird in Zukunft möglicherweise erweitert. Wir beobachten das Feedback von Kund:innen, um zu entscheiden, wann und wie wir die Unterstützung ausweiten.