ЧЗВ за входните изображения в ChatGPT

Вашият наръчник за новата функция за входни изображения в ChatGPT — от ефективното ѝ използване до разбирането на ограниченията ѝ

Какво представляват входните изображения и как работят в ChatGPT?

ChatGPT вече има възможности за работа с изображения, за да разбира и интерпретира изображенията, които добавяте към разговори като входни изображения.

Как да използвам входни изображения в разговори?

Основна употреба: За начало качете снимка. Задавайте въпроси за обекти в изображения, анализирайте документи или разглеждайте визуално съдържание. Добавяйте още изображения в следващи реплики, за да задълбочите или промените посоката на обсъждането. Можете да се върнете по всяко време с нови снимки.

Анотиране на изображения: За да насочите вниманието към конкретни области, можете да използвате инструмент за маркиране при редактиране на снимки върху изображението, преди да го качите. Това помага на ChatGPT да се фокусира върху елементите, които смятате за важни.

Кои планове могат да използват входни изображения?

Plus и ChatGPT Enterprise. В мобилната уеб версия можете също да прикачвате снимки, преди да влезете в профила си.

Кои модели могат да приемат входни изображения?

Всички модели на ChatGPT могат да приемат входни изображения.

На кои платформи са налични входните изображения?

На всички платформи, включително в уеб (chatgpt.com) и на мобилни устройства (iOS / Android).

Използват ли се моите изображения за подобряване на вашите модели?

Подходът ни към използването на съдържание, включително изображения, остава един и същ за всеки продукт.

Вижте Как се използват данните ви за подобряване на ефективността на модела, за да разберете по-добре как съдържанието в ChatGPT може да се използва за подобряване на ефективността на модела и какви възможности за избор имат потребителите.

При ChatGPT Enterprise не използваме съдържание за обучение на нашите модели.

Как да добавя входни изображения в ChatGPT?

Докоснете иконата + в полето за подкана и изберете Добавяне на снимки и файлове. Можете също да плъзнете файл с изображение в текстовото поле или да поставите изображение, копирано в клипборда.

Поддържат ли входните изображения видеоклипове?

Не, не може да обработва видеоклипове. В момента се поддържа обработка само на статични изображения.

Какви типове файлове се поддържат?

PNG (.png), JPEG (.jpeg и .jpg) и неанимирани GIF (.gif).

Колко изображения мога да кача наведнъж?

Броят изображения, които можете да добавите към разговор, зависи от различни фактори, включително размера на изображенията и количеството текст към тях. Като обща препоръка, ако срещнете проблеми, опитайте да намалите броя или размера на изображенията.

Какво е ограничението за размер на изображение?

20 MB.

Как възможностите за работа с изображения обработват двусмислени или неясни изображения?

Ако дадено изображение е двусмислено или неясно, моделът ще направи всичко възможно да го интерпретира. Резултатите обаче може да са по-малко точни.

С какви ограничения трябва да са наясно потребителите, когато използват ChatGPT с входни изображения?

Ако използвате новата функция за входни изображения на ChatGPT, важно е да сте наясно със следните ограничения:

Медицински изображения: Моделът не е подходящ за интерпретиране на специализирани медицински изображения, като компютърни томографии, и не бива да се използва за медицински съвети.
Неанглийски текст: Моделът не се справя толкова добре с изображения, съдържащи текст на нелатински писмености, като японски или корейски.
Голям текст: Увеличете текста в изображението, за да подобрите четливостта, но избягвайте да изрязвате важни детайли.
Завъртане: Моделът може да интерпретира погрешно завъртян или обърнат с главата надолу текст или изображения.
Визуални елементи: Моделът може да изпитва затруднения при разбирането на графики или текст, когато цветовете или стиловете, като плътни, прекъснати или пунктирани линии, се различават.
Пространствени задачи: Моделът се затруднява със задачи, изискващи точно пространствено локализиране, например определяне на шахматни позиции.
Точност: В определени сценарии моделът може да генерира неправилни описания или надписи.
Форма: Моделът се затруднява с панорамни изображения и изображения тип „рибешко око“.
Метаданни и преоразмеряване: Моделът не обработва оригиналните имена на файлове или метаданните, а изображенията се преоразмеряват преди анализ, което засяга първоначалните им размери.
Броене: Може да даде приблизителен брой на обектите в изображенията.