OpenAI
Ta strona została przetłumaczona maszynowo. Wyświetl oryginalny artykuł w języku angielskim.

FAQ: wizualne wyszukiwanie w plikach PDF

Zaktualizowano: 12 days ago

Co to za funkcja?

ChatGPT Enterprise obsługuje teraz odczytywanie i rozumienie elementów wizualnych (obrazów, wykresów, diagramów itp.) osadzonych w plikach PDF dołączonych do poleceń. Użytkownicy mogą przesłać plik PDF, a ChatGPT może interpretować tekst i wszelkie elementy wizualne w tym pliku.

Jak to działa?

  1. Kliknij ikonę spinacza (załącznika) na czacie, aby przesłać plik PDF.

  2. ChatGPT odczyta zarówno tekst, jak i wszelkie osadzone obrazy lub diagramy w pliku PDF.

  3. Następnie możesz zadawać pytania lub prosić o podsumowania — od wyodrębnienia głównych punktów raportu po wyjaśnienie złożonych wykresów.

Czy jest zgodna z GPTs i Projektami?

Częściowo. Pliki PDF przesłane jako wiedza GPT lub pliki projektu są przetwarzane przy użyciu wyszukiwania tylko tekstowego. Pliki PDF przesyłane przez użytkowników podczas interakcji z opublikowanym GPT lub w ramach rozmowy w Projekcie są przetwarzane przy użyciu wyszukiwania wizualnego.

Kto może z tego korzystać?

Ta funkcja jest dostępna wyłącznie dla klientów ChatGPT Enterprise. Nie jest obsługiwana dla kont ChatGPT Free, Pro, Team ani Edu.

Jaki problem to rozwiązuje?

Wcześniej ChatGPT mógł przetwarzać obrazy tylko wtedy, gdy były przesyłane osobno (np. jako pliki PNG/JPEG). Osadzone elementy wizualne w pliku PDF były pomijane. Teraz ChatGPT może zapewnić bardziej całościową analizę — łącząc tekst i elementy wizualne za jednym razem — co prowadzi do trafniejszych i bogatszych kontekstowo odpowiedzi.

Czy ta funkcja będzie docelowo dostępna także w innych planach?

Obecnie jest dostępna wyłącznie w planie Enterprise i może zostać rozszerzona w przyszłości. Monitorujemy opinie klientów, aby określić, kiedy i w jaki sposób poszerzyć wsparcie.

Czy ten artykuł był pomocny?