Čo sú obrazové vstupy a ako fungujú v ChatGPT?
ChatGPT teraz disponuje obrazovými funkciami, vďaka ktorým dokáže porozumieť obrázkom, ktoré pridáte do konverzácií ako obrazové vstupy, a interpretovať ich.
Ako mám používať obrazové vstupy v konverzáciách?
Základné použitie: Na začiatok nahrajte fotku. Pýtajte sa na objekty na obrázkoch, analyzujte dokumenty alebo skúmajte vizuálny obsah. V ďalších častiach konverzácie pridajte ďalšie obrázky, aby ste diskusiu prehĺbili alebo zmenili jej smer. Kedykoľvek sa vráťte s novými fotkami.
Anotovanie obrázkov: Ak chcete upriamiť pozornosť na konkrétne oblasti, pred nahraním zvážte použitie nástroja na označovanie pri úprave fotky. Pomôže to ChatGPT zamerať sa na prvky, ktoré považujete za dôležité.
Ktoré plány môžu používať obrazové vstupy?
Plus a ChatGPT Enterprise. Na mobilnom webe môžete fotky priložiť aj pred prihlásením.
Ktoré modely dokážu prijímať obrazové vstupy?
Všetky modely ChatGPT dokážu prijímať obrazové vstupy.
Na ktorých platformách sú dostupné obrazové vstupy?
Na všetkých platformách vrátane webu (chatgpt.com) a mobilných zariadení (iOS / Android).
Používajú sa moje obrázky na zlepšovanie vašich modelov?
Náš prístup k používaniu obsahu vrátane obrázkov zostáva rovnaký pre každý produkt.
Pozrite si článok Ako sa vaše údaje používajú na zlepšenie výkonu modelu, aby ste lepšie pochopili, ako sa obsah v ChatGPT môže používať na zlepšenie výkonu modelu a aké možnosti majú používatelia.
V prípade služby ChatGPT Enterprise nepoužívame obsah na trénovanie našich modelov.
Ako pridám obrazové vstupy v ChatGPT?
Ťuknite na ikonu + v oblasti príkazu a vyberte možnosť Pridať fotky a súbory. Prípadne môžete súbor s obrázkom presunúť do textovej oblasti alebo vložiť obrázok skopírovaný do schránky.
Podporujú obrazové vstupy videá?
Nie, videá spracovať nedokáže. Momentálne podporuje iba spracovanie statických obrázkov.
Koľko obrázkov môžem nahrať naraz?
Počet obrázkov, ktoré môžete pridať do konverzácie, závisí od rôznych faktorov vrátane veľkosti obrázkov a množstva textu, ktorý ich sprevádza. Vo všeobecnosti platí, že ak narazíte na problémy, zvážte zníženie počtu alebo veľkosti obrázkov.
Aký je limit veľkosti na jeden obrázok?
20 MB.
Ako obrazové funkcie spracúvajú nejednoznačné alebo nejasné obrázky?
Ak je obrázok nejednoznačný alebo nejasný, model sa ho pokúsi čo najlepšie interpretovať. Výsledky však môžu byť menej presné.
Na aké obmedzenia by si používatelia mali dávať pozor pri používaní ChatGPT s obrazovými vstupmi?
Ak používate novú funkciu obrazových vstupov v ChatGPT, je dôležité poznať tieto obmedzenia:
Medicína: Model nie je vhodný na interpretáciu špecializovaných medicínskych snímok, ako sú CT snímky, a nemal by sa používať na lekárske rady.
Neanglický text: Model nedosahuje také dobré výsledky pri práci s obrázkami obsahujúcimi text v nelatinkových abecedách, napríklad v japončine alebo kórejčine.
Veľký text: Zväčšite text v obrázku, aby sa zlepšila čitateľnosť, ale vyhnite sa orezaniu dôležitých detailov.
Otočenie: Model môže nesprávne interpretovať otočený text alebo obrázky, prípadne text alebo obrázky hore nohami.
Vizuálne prvky: Model môže mať problém porozumieť grafom alebo textu, kde sa líšia farby či štýly, napríklad plné, prerušované alebo bodkované čiary.
Priestorové určenie: Model má problém s úlohami vyžadujúcimi presnú priestorovú lokalizáciu, napríklad s určovaním šachových pozícií.
Presnosť: Model môže v určitých scenároch generovať nesprávne opisy alebo titulky.
Tvar: Model má problém s panoramatickými obrázkami a obrázkami typu rybie oko.
Metadáta a zmena veľkosti: Model nespracúva pôvodné názvy súborov ani metadáta a obrázky sa pred analýzou zmenšia alebo zväčšia, čo ovplyvní ich pôvodné rozmery.
Počítanie: Pri objektoch na obrázkoch môže uvádzať približné počty.
