FAQ sugli input di immagini di ChatGPT

La guida per orientarti nella nuova funzionalità di input di immagini di ChatGPT: come usarla in modo efficace e comprenderne i limiti

Che cosa sono gli input di immagini e come funzionano in ChatGPT?

ChatGPT ora dispone di funzionalità per comprendere e interpretare le immagini che aggiungi alle conversazioni come input di immagini.

Come dovrei usare gli input di immagini nelle conversazioni?

Uso di base: carica una foto per iniziare. Fai domande sugli oggetti presenti nelle immagini, analizza documenti o esplora contenuti visivi. Aggiungi altre immagini nei turni successivi per approfondire o cambiare la discussione. Puoi tornare in qualsiasi momento con nuove foto.

Annotazione delle immagini: per richiamare l’attenzione su aree specifiche, valuta di usare uno strumento di annotazione per modificare la foto prima di caricarla. Questo aiuta ChatGPT a concentrarsi sugli elementi che ritieni importanti.

Quali piani possono usare gli input di immagini?

Plus e ChatGPT Enterprise. Sul web mobile, puoi anche allegare foto prima di accedere.

Quali modelli possono accettare input di immagini?

Tutti i modelli ChatGPT possono accettare input di immagini.

Su quali piattaforme sono disponibili gli input di immagini?

Su tutte le piattaforme, inclusi web (chatgpt.com) e mobile (iOS / Android).

Le mie immagini vengono usate per migliorare i vostri modelli?

Il nostro approccio all’uso dei contenuti, incluse le immagini, resta lo stesso per ogni prodotto.

Consulta Come vengono usati i tuoi dati per migliorare le prestazioni dei modelli per capire meglio in che modo i contenuti su ChatGPT possono essere usati per migliorare le prestazioni dei modelli e quali opzioni hanno gli utenti.

Per ChatGPT Enterprise, non usiamo i contenuti per addestrare i nostri modelli.

Come faccio ad aggiungere input di immagini in ChatGPT?

Tocca l’icona + nell’area del prompt e seleziona Aggiungi foto e file. In alternativa, puoi trascinare un file immagine nell’area di testo o incollare un’immagine copiata negli appunti.

Gli input di immagini supportano i video?

No, non supportano i video. Attualmente supportano solo l’elaborazione di immagini statiche.

Quali tipi di file sono supportati?

PNG (.png), JPEG (.jpeg e .jpg) e GIF non animati (.gif).

Quante immagini posso caricare contemporaneamente?

Il numero di immagini che puoi aggiungere a una conversazione dipende da vari fattori, tra cui le dimensioni delle immagini e la quantità di testo che le accompagna. Come regola generale, se riscontri problemi, prova a ridurre il numero o le dimensioni delle immagini.

Qual è il limite di dimensione per ogni immagine?

20 MB.

In che modo le funzionalità per le immagini gestiscono immagini ambigue o poco chiare?

Se un’immagine è ambigua o poco chiara, il modello farà del suo meglio per interpretarla. Tuttavia, i risultati potrebbero essere meno accurati.

Di quali limiti dovrebbero essere consapevoli gli utenti quando usano ChatGPT con gli input di immagini?

Se usi la nuova funzionalità di input di immagini di ChatGPT, è importante conoscere questi limiti:

Medico: il modello non è adatto a interpretare immagini mediche specialistiche, come le TAC, e non dovrebbe essere usato per consigli medici.
Lingue diverse dall’inglese: il modello offre prestazioni inferiori nella gestione di immagini con testo in alfabeti non latini, come il giapponese o il coreano.
Testo grande: ingrandisci il testo nell’immagine per migliorarne la leggibilità, ma evita di ritagliare dettagli importanti.
Rotazione: il modello potrebbe interpretare in modo errato testo o immagini ruotati o capovolti.
Elementi visivi: il modello potrebbe avere difficoltà a comprendere grafici o testo in cui variano colori o stili, come linee continue, tratteggiate o puntinate.
Spaziale: il modello ha difficoltà con attività che richiedono una localizzazione spaziale precisa, come identificare le posizioni degli scacchi.
Accuratezza: il modello potrebbe generare descrizioni o didascalie errate in determinati scenari.
Forma: il modello ha difficoltà con immagini panoramiche e fisheye.
Metadati e ridimensionamento: il modello non elabora i nomi file originali né i metadati; inoltre, le immagini vengono ridimensionate prima dell’analisi, con effetti sulle dimensioni originali.
Conteggio: può fornire conteggi approssimativi degli oggetti nelle immagini.