OpenAI
Тази страница е машинно преведена. Вижте оригиналната статия на английски език.

ЧЗВ за входни изображения в ChatGPT

Вашето ръководство за новата функция за входни изображения в ChatGPT — от ефективното ѝ използване до разбирането на нейните ограничения

Актуализирано: 14 days ago

Какво представляват входните изображения и как работят в ChatGPT?

ChatGPT вече има възможности за работа с изображения, за да разбира и интерпретира изображенията, които добавяте в разговорите като входни изображения.

Как да използвам входните изображения в разговори?

Основна употреба: Качете снимка, за да започнете. Питайте за обекти в изображения, анализирайте документи или разглеждайте визуално съдържание. Добавяйте още изображения в следващите съобщения, за да задълбочите или насочите разговора в друга посока. Връщайте се по всяко време с нови снимки.

Анотиране на изображения: За да насочите вниманието към конкретни области, обмислете да използвате инструмент за маркиране при редактиране на снимки върху изображението си преди качване. Това насочва ChatGPT да се фокусира върху елементите, които смятате за важни.

Кои планове могат да използват входни изображения?

Plus и ChatGPT Enterprise.

Кои модели могат да приемат входни изображения?

Всички модели на ChatGPT могат да приемат входни изображения.

На кои платформи са налични входните изображения?

На всички платформи, включително уеб (chatgpt.com) и мобилни устройства (iOS / Android).

Използват ли се моите изображения за подобряване на вашите модели?

Подходът ни към използването на съдържание, включително изображения, остава еднакъв за всеки продукт.

Моля, вижте Как се използват вашите данни за подобряване на производителността на моделите, за да разберете по-добре как съдържанието в ChatGPT може да се използва за подобряване на производителността на моделите и какви избори имат потребителите.

За ChatGPT Enterprise не използваме съдържание за обучение на нашите модели.

Как да добавя входни изображения в ChatGPT?

Докоснете иконата + в областта за подкана и изберете Add photos & files. Като алтернатива можете да плъзнете файл с изображение в текстовата област или да поставите изображение, копирано в клипборда.

Поддържат ли входните изображения видеоклипове?

Не, не може да обработва видеоклипове. В момента поддържа обработка само на статични изображения.

Кои типове файлове се поддържат?

PNG (.png), JPEG (.jpeg и .jpg) и неанимирани GIF (.gif).

Колко изображения мога да кача наведнъж?

Броят изображения, които можете да добавите към разговор, зависи от различни фактори, включително размера на изображенията и количеството текст, което ги придружава. Като общо правило, ако срещнете проблеми, помислете за намаляване на броя или размера на изображенията.

Какво е ограничението за размер на едно изображение?

20MB.

Как възможностите за работа с изображения обработват двусмислени или неясни изображения?

Ако едно изображение е двусмислено или неясно, моделът ще направи всичко възможно да го интерпретира. Въпреки това резултатите може да са по-малко точни.

С какви ограничения трябва да са наясно потребителите, когато използват ChatGPT с входни изображения?

Ако използвате новата функция за входни изображения на ChatGPT, е важно да сте наясно със следните ограничения:

  1. Медицински: Моделът не е подходящ за интерпретиране на специализирани медицински изображения като компютърни томографии и не бива да се използва за медицински съвети.

  2. Неанглийски езици: Моделът не се справя толкова добре с обработката на изображения с текст на нелатински азбуки, като японски или корейски.

  3. Голям текст: Увеличете текста в изображението, за да подобрите четимостта, но избягвайте да изрязвате важни детайли.

  4. Завъртане: Моделът може да интерпретира погрешно завъртян / обърнат надолу текст или изображения.

  5. Визуални елементи: Моделът може да има затруднения да разбере графики или текст, при които цветовете или стиловете, като плътни, прекъснати или пунктирани линии, се различават.

  6. Пространствени отношения: Моделът се затруднява със задачи, изискващи прецизна пространствена локализация, като например идентифициране на позиции в шахмат.

  7. Точност: В определени сценарии моделът може да генерира неправилни описания или надписи.

  8. Форма: Моделът се затруднява с панорамни изображения и изображения тип „рибешко око“.

  9. Метаданни и преоразмеряване: Моделът не обработва оригиналните имена на файловете или метаданните, а изображенията се преоразмеряват преди анализа, което влияе на първоначалните им размери.

  10. Броене: Може да дава приблизителен брой на обекти в изображения.

Беше ли Ви полезна тази статия?