ChatGPT vaizdų įvesties DUK

Jūsų vadovas apie naująją ChatGPT vaizdų įvesties funkciją: kaip ją veiksmingai naudoti ir suprasti jos ribojimus

Kas yra vaizdų įvestis ir kaip ji veikia ChatGPT?

ChatGPT dabar turi vaizdų funkcijų, leidžiančių suprasti ir interpretuoti vaizdus, kuriuos į pokalbius pridedate kaip vaizdų įvestį.

Kaip naudoti vaizdų įvestį pokalbiuose?

Pagrindinis naudojimas: norėdami pradėti, įkelkite nuotrauką. Klauskite apie objektus vaizduose, analizuokite dokumentus arba tyrinėkite vaizdinį turinį. Vėlesniuose pokalbio etapuose pridėkite daugiau vaizdų, kad pagilintumėte arba pakeistumėte diskusijos kryptį. Bet kada grįžkite su naujomis nuotraukomis.

Vaizdų anotavimas: norėdami atkreipti dėmesį į konkrečias sritis, prieš įkeldami vaizdą galite naudoti nuotraukų redagavimo žymėjimo įrankį. Tai padeda ChatGPT sutelkti dėmesį į elementus, kuriuos laikote svarbiais.

Kuriuose planuose galima naudoti vaizdų įvestį?

„Plus“ ir ChatGPT Enterprise. Mobiliajame žiniatinklyje nuotraukas taip pat galite pridėti prieš prisijungdami.

Kurie modeliai gali priimti vaizdų įvestį?

Visi ChatGPT modeliai gali priimti vaizdų įvestį.

Kuriose platformose galima naudoti vaizdų įvestį?

Visose platformose, įskaitant žiniatinklį (chatgpt.com) ir mobiliuosius įrenginius („iOS“ / „Android“).

Ar mano vaizdai naudojami jūsų modeliams tobulinti?

Mūsų požiūris į turinio, įskaitant vaizdus, naudojimą išlieka toks pats kiekviename produkte.

Žr. Kaip jūsų duomenys naudojami modelio našumui gerinti, kad geriau suprastumėte, kaip ChatGPT turinys gali būti naudojamas modelio našumui gerinti ir kokias pasirinkimo galimybes turi naudotojai.

Naudojant ChatGPT Enterprise, turinio nenaudojame savo modeliams mokyti.

Kaip pridėti vaizdų įvestį ChatGPT?

Užklausos srityje palieskite piktogramą + ir pasirinkite Pridėti nuotraukas ir failus. Taip pat galite nuvilkti vaizdo failą į teksto sritį arba įklijuoti į iškarpinę nukopijuotą vaizdą.

Ar vaizdų įvestis palaiko vaizdo įrašus?

Ne, ji negali apdoroti vaizdo įrašų. Šiuo metu palaikomas tik statinių vaizdų apdorojimas.

Kokie failų tipai palaikomi?

PNG (.png), JPEG (.jpeg ir .jpg) ir neanimuoti GIF (.gif).

Kiek vaizdų galiu įkelti vienu metu?

Vaizdų, kuriuos galite pridėti prie pokalbio, skaičius priklauso nuo įvairių veiksnių, įskaitant vaizdų dydį ir juos lydinčio teksto kiekį. Paprastai, jei kyla problemų, pabandykite sumažinti vaizdų skaičių arba dydį.

Koks yra vieno vaizdo dydžio limitas?

20 MB.

Kaip vaizdų funkcijos apdoroja dviprasmiškus ar neaiškius vaizdus?

Jei vaizdas yra dviprasmiškas ar neaiškus, modelis stengsis jį kuo geriau interpretuoti. Tačiau rezultatai gali būti mažiau tikslūs.

Kokius ribojimus naudotojai turėtų žinoti naudodami ChatGPT su vaizdų įvestimi?

Jei naudojate naująją ChatGPT vaizdų įvesties funkciją, svarbu žinoti šiuos ribojimus:

Medicina: modelis netinka specializuotiems medicininiams vaizdams, pvz., KT nuotraukoms, interpretuoti ir neturėtų būti naudojamas medicininėms konsultacijoms.
Ne anglų kalba: modelis prasčiau apdoroja vaizdus su nelotyniškų abėcėlių, pavyzdžiui, japonų ar korėjiečių, tekstu.
Didelis tekstas: padidinkite tekstą vaizde, kad jis būtų lengviau įskaitomas, bet neapkirpkite svarbių detalių.
Pasukimas: modelis gali klaidingai interpretuoti pasuktą arba aukštyn kojomis apverstą tekstą ar vaizdus.
Vizualiniai elementai: modeliui gali būti sunku suprasti grafikus ar tekstą, kai skiriasi spalvos ar stiliai, pvz., ištisinės, brūkšninės ar taškinės linijos.
Erdvinė orientacija: modeliui sunkiai sekasi užduotys, kurioms reikia tikslaus erdvinio nustatymo, pavyzdžiui, šachmatų pozicijų atpažinimas.
Tikslumas: tam tikrais atvejais modelis gali sugeneruoti neteisingus aprašymus ar antraštes.
Forma: modeliui sunku apdoroti panoraminius ir „fisheye“ tipo vaizdus.
Metaduomenys ir dydžio keitimas: modelis neapdoroja pradinių failų pavadinimų ar metaduomenų, o prieš analizę vaizdų dydis pakeičiamas, todėl pakinta jų pradiniai matmenys.
Skaičiavimas: gali pateikti apytikslius vaizduose esančių objektų skaičius.