FAQ: obrazy wejściowe w ChatGPT

Twój przewodnik po nowej funkcji obrazów wejściowych w ChatGPT: od skutecznego używania po zrozumienie jej ograniczeń

Czym są obrazy wejściowe i jak działają w ChatGPT?

ChatGPT ma teraz funkcje rozumienia i interpretowania obrazów dodawanych do rozmów jako obrazy wejściowe.

Jak korzystać z obrazów wejściowych w rozmowach?

Podstawowe użycie: Prześlij zdjęcie, aby zacząć. Pytaj o obiekty na obrazach, analizuj dokumenty lub poznawaj treści wizualne. Dodawaj kolejne obrazy w późniejszych wypowiedziach, aby pogłębić lub zmienić temat rozmowy. Wróć w dowolnym momencie z nowymi zdjęciami.

Adnotacje na obrazach: Aby zwrócić uwagę na konkretne obszary, przed przesłaniem obrazu możesz użyć narzędzia do oznaczania w edytorze zdjęć. Dzięki temu ChatGPT skupi się na elementach, które uważasz za ważne.

Które plany umożliwiają korzystanie z obrazów wejściowych?

Plus i ChatGPT Enterprise. W przeglądarce mobilnej możesz też załączać zdjęcia przed zalogowaniem.

Które modele mogą przyjmować obrazy wejściowe?

Wszystkie modele ChatGPT mogą przyjmować obrazy wejściowe.

Na których platformach można korzystać z obrazów wejściowych?

Na wszystkich platformach, w tym w przeglądarce (chatgpt.com) i na urządzeniach mobilnych (iOS / Android).

Czy moje obrazy są używane do ulepszania Waszych modeli?

Nasze podejście do wykorzystywania treści, w tym obrazów, pozostaje takie samo dla każdego produktu.

Zapoznaj się z artykułem Jak Twoje dane są wykorzystywane do poprawy wydajności modelu, aby lepiej zrozumieć, jak treści w ChatGPT mogą być używane do poprawy wydajności modelu oraz jakie możliwości wyboru mają użytkownicy.

W przypadku ChatGPT Enterprise nie używamy treści do trenowania naszych modeli.

Jak dodać obrazy wejściowe w ChatGPT?

Stuknij ikonę + w obszarze polecenia i wybierz Dodaj zdjęcia i pliki. Możesz też przeciągnąć plik obrazu do pola tekstowego albo wkleić obraz skopiowany do schowka.

Czy obrazy wejściowe obsługują filmy?

Nie, ta funkcja nie obsługuje filmów. Obecnie obsługiwane jest tylko przetwarzanie obrazów statycznych.

Jakie typy plików są obsługiwane?

PNG (.png), JPEG (.jpeg i .jpg) oraz nieanimowane pliki GIF (.gif).

Ile obrazów mogę przesłać naraz?

Liczba obrazów, które możesz dodać do rozmowy, zależy od różnych czynników, w tym od ich rozmiaru oraz ilości towarzyszącego im tekstu. Ogólnie, jeśli napotkasz problemy, zmniejsz liczbę lub rozmiar obrazów.

Jaki jest limit rozmiaru jednego obrazu?

20 MB.

Jak funkcje obsługi obrazów radzą sobie z obrazami niejednoznacznymi lub niewyraźnymi?

Jeśli obraz jest niejednoznaczny lub niewyraźny, model postara się go zinterpretować najlepiej, jak potrafi. Wyniki mogą być jednak mniej dokładne.

O jakich ograniczeniach powinni wiedzieć użytkownicy korzystający z ChatGPT z obrazami wejściowymi?

Jeśli korzystasz z nowej funkcji obrazów wejściowych w ChatGPT, warto znać te ograniczenia:

Medycyna: Model nie nadaje się do interpretowania specjalistycznych obrazów medycznych, takich jak skany TK, i nie powinien być używany do porad medycznych.
Języki inne niż angielski: Model gorzej radzi sobie z obrazami zawierającymi tekst zapisany alfabetami innymi niż łaciński, takimi jak japoński czy koreański.
Duży tekst: Powiększ tekst na obrazie, aby poprawić czytelność, ale unikaj przycinania ważnych szczegółów.
Obrót: Model może błędnie interpretować obrócony tekst lub obrazy albo tekst i obrazy do góry nogami.
Elementy wizualne: Model może mieć trudności ze zrozumieniem wykresów lub tekstu, gdy różnią się kolory albo style, np. linie ciągłe, przerywane lub kropkowane.
Relacje przestrzenne: Model ma trudności z zadaniami wymagającymi precyzyjnej lokalizacji przestrzennej, np. rozpoznawaniem pozycji szachowych.
Dokładność: W niektórych sytuacjach model może generować nieprawidłowe opisy lub podpisy.
Kształt: Model ma trudności z obrazami panoramicznymi i typu „rybie oko”.
Metadane i zmiana rozmiaru: Model nie przetwarza oryginalnych nazw plików ani metadanych, a obrazy są przed analizą skalowane, co wpływa na ich pierwotne wymiary.
Liczenie: Może podawać przybliżone liczby obiektów na obrazach.