Поширені запитання про вхідні зображення в ChatGPT

Посібник із нової функції введення зображень у ChatGPT: як ефективно нею користуватися та які вона має обмеження

Що таке вхідні зображення і як вони працюють у ChatGPT?

ChatGPT тепер має можливості роботи із зображеннями, щоб розуміти й інтерпретувати зображення, які ви додаєте до розмов як вхідні дані.

Як використовувати вхідні зображення в розмовах?

Основне використання: завантажте фото, щоб почати. Запитуйте про об’єкти на зображеннях, аналізуйте документи або досліджуйте візуальний контент. Додавайте більше зображень у наступних репліках, щоб поглибити або змінити напрям обговорення. Повертайтеся будь-коли з новими фото.

Анотування зображень: щоб привернути увагу до певних ділянок, перед завантаженням скористайтеся інструментом розмітки для редагування фото. Це допоможе ChatGPT зосередитися на елементах, які ви вважаєте важливими.

У яких планах доступні вхідні зображення?

Plus і ChatGPT Enterprise. У мобільній вебверсії фото також можна прикріплювати до входу в обліковий запис.

Які моделі можуть приймати вхідні зображення?

Усі моделі ChatGPT можуть приймати вхідні зображення.

На яких платформах доступні вхідні зображення?

На всіх платформах, зокрема у вебверсії (chatgpt.com) і на мобільних пристроях (iOS / Android).

Чи використовуються мої зображення для покращення ваших моделей?

Наш підхід до використання контенту, зокрема зображень, залишається однаковим для кожного продукту.

Щоб краще зрозуміти, як контент у ChatGPT може використовуватися для покращення роботи моделей і які можливості вибору мають користувачі, перегляньте статтю Як ваші дані використовуються для покращення роботи моделей.

Для ChatGPT Enterprise ми не використовуємо контент для навчання наших моделей.

Як додати вхідні зображення в ChatGPT?

Торкніться значка + в області запиту й виберіть Додати фото та файли. Також можна перетягнути файл зображення в текстову область або вставити зображення, скопійоване в буфер обміну.

Чи підтримують вхідні зображення відео?

Ні, відео не обробляються. Наразі підтримується обробка лише статичних зображень.

Які типи файлів підтримуються?

PNG (.png), JPEG (.jpeg і .jpg), а також неанімовані GIF (.gif).

Скільки зображень можна завантажити одночасно?

Кількість зображень, які можна додати до розмови, залежить від різних чинників, зокрема розміру зображень і обсягу тексту, що їх супроводжує. Як загальна порада: якщо виникають проблеми, спробуйте зменшити кількість або розмір зображень.

Яке обмеження розміру для одного зображення?

20 МБ.

Як функції роботи із зображеннями обробляють неоднозначні або нечіткі зображення?

Якщо зображення неоднозначне або нечітке, модель зробить усе можливе, щоб його інтерпретувати. Однак результати можуть бути менш точними.

Про які обмеження слід знати користувачам, які працюють із вхідними зображеннями в ChatGPT?

Якщо ви користуєтеся новою функцією введення зображень у ChatGPT, важливо знати про такі обмеження:

Медицина: модель не підходить для інтерпретації спеціалізованих медичних зображень, як-от КТ-знімків, і її не слід використовувати для медичних порад.
Неанглійська мова: модель гірше обробляє зображення з текстом, написаним нелатинськими абетками, наприклад японською чи корейською.
Великий текст: збільшуйте текст на зображенні, щоб покращити читабельність, але не обрізайте важливі деталі.
Поворот: модель може неправильно інтерпретувати повернутий або перевернутий текст чи зображення.
Візуальні елементи: модель може мати труднощі з розумінням графіків або тексту, де відрізняються кольори чи стилі, наприклад суцільні, штрихові або пунктирні лінії.
Просторове розташування: модель має труднощі із завданнями, що потребують точної просторової локалізації, наприклад визначення шахових позицій.
Точність: у певних сценаріях модель може створювати неправильні описи або підписи.
Форма: модель має труднощі з панорамними зображеннями та зображеннями «риб’яче око».
Метадані та зміна розміру: модель не обробляє оригінальні імена файлів або метадані, а перед аналізом розмір зображень змінюється, що впливає на їхні початкові розміри.
Підрахунок: може давати приблизну кількість об’єктів на зображеннях.