FAQ: wizualne wyszukiwanie w plikach PDF

Co to za funkcja?

ChatGPT Enterprise obsługuje teraz odczytywanie i rozumienie elementów wizualnych (obrazów, wykresów, diagramów itp.) osadzonych w plikach PDF dołączonych do poleceń. Użytkownicy mogą przesłać plik PDF, a ChatGPT zinterpretuje tekst oraz wszelkie elementy wizualne w tym pliku.

Jak to działa?

Kliknij ikonę spinacza (załącznika) na czacie, aby przesłać plik PDF.
ChatGPT odczyta zarówno tekst, jak i wszelkie osadzone obrazy lub diagramy w pliku PDF.
Następnie możesz zadawać pytania lub prosić o podsumowania — od wyodrębnienia głównych punktów raportu po wyjaśnienie złożonych wykresów.

Czy jest to zgodne z GPT i Projektami?

Częściowo. Pliki PDF przesłane jako wiedza GPT lub pliki projektu są przetwarzane z użyciem wyszukiwania tylko w tekście. Pliki PDF przesłane przez użytkowników podczas interakcji z opublikowanym GPT lub w ramach rozmowy w projekcie są przetwarzane z użyciem wyszukiwania wizualnego.

Kto może z tego korzystać?

Ta funkcja jest dostępna tylko dla klientów ChatGPT Enterprise. Nie jest obsługiwana na kontach ChatGPT Free, Pro, Team ani Edu.

Jaki problem rozwiązuje?

Wcześniej ChatGPT mógł przetwarzać obrazy tylko wtedy, gdy były przesyłane osobno (np. jako pliki PNG/JPEG). Elementy wizualne osadzone w pliku PDF były pomijane. Teraz ChatGPT może zapewnić bardziej całościową analizę — łącząc tekst i elementy wizualne za jednym razem — co prowadzi do dokładniejszych odpowiedzi, bogatszych w kontekst.

Czy ta funkcja zostanie ostatecznie rozszerzona na inne plany?

Obecnie jest dostępna wyłącznie w planie Enterprise i może zostać rozszerzona w przyszłości. Monitorujemy opinie klientów, aby ustalić, kiedy i jak rozszerzyć obsługę.