OpenAI
Questa pagina è stata tradotta automaticamente. Visualizza l'articolo originale in inglese.

FAQ sugli input di immagini di ChatGPT

La tua guida per orientarti nella nuova funzione di input di immagini di ChatGPT: da come usarla in modo efficace a come capirne i limiti

Aggiornato: 12 days ago

Cosa sono gli input di immagini e come funzionano in ChatGPT?

ChatGPT ora dispone di funzionalità per comprendere e interpretare le immagini che aggiungi alle conversazioni come input di immagini.

Come dovrei usare gli input di immagini nelle conversazioni?

Uso di base: Inizia caricando una foto. Chiedi informazioni sugli oggetti nelle immagini, analizza documenti o esplora contenuti visivi. Aggiungi altre immagini nei turni successivi per approfondire o spostare la discussione. Torna quando vuoi con nuove foto.

Annotare le immagini: Per richiamare l’attenzione su aree specifiche, valuta l’uso di uno strumento di modifica/markup sulla foto prima di caricarla. Questo aiuta ChatGPT a concentrarsi sugli elementi che ritieni importanti.

Quali piani possono usare gli input di immagini?

Plus e ChatGPT Enterprise.

Quali modelli possono accettare input di immagini?

Tutti i modelli di ChatGPT possono accettare input di immagini.

Su quali piattaforme sono disponibili gli input di immagini?

Su tutte le piattaforme, inclusi web (chatgpt.com) e mobile (iOS / Android).

Le mie immagini vengono usate per migliorare i vostri modelli?

Il nostro approccio all’uso dei contenuti, incluse le immagini, resta lo stesso per ciascun prodotto.

Consulta Come vengono usati i tuoi dati per migliorare le prestazioni del modello per capire meglio come i contenuti su ChatGPT possano essere utilizzati per migliorare le prestazioni del modello e quali scelte hanno gli utenti.

Per ChatGPT Enterprise, non utilizziamo i contenuti per addestrare i nostri modelli.

Come aggiungo input di immagini in ChatGPT?

Tocca l’icona + nell’area del prompt e seleziona Aggiungi foto e file. In alternativa, puoi trascinare un file immagine nell’area di testo oppure incollare un’immagine copiata negli appunti.

Gli input di immagini supportano i video?

No, non è in grado di gestire i video. Attualmente supporta solo l’elaborazione di immagini statiche.

Quali tipi di file sono supportati?

PNG (.png), JPEG (.jpeg e .jpg) e GIF non animati (.gif).

Quante immagini posso caricare in una sola volta?

Il numero di immagini che puoi aggiungere a una conversazione dipende da vari fattori, tra cui la dimensione delle immagini e la quantità di testo che le accompagna. Come linea guida generale, se riscontri problemi, valuta di ridurre il numero o la dimensione delle immagini.

Qual è il limite di dimensione per immagine?

20MB.

Come gestiscono queste funzionalità le immagini ambigue o poco chiare?

Se un’immagine è ambigua o poco chiara, il modello farà del suo meglio per interpretarla. Tuttavia, i risultati potrebbero essere meno accurati.

Di quali limitazioni dovrebbero essere consapevoli gli utenti quando usano ChatGPT con gli input di immagini?

Se utilizzi la nuova funzione di input di immagini di ChatGPT, è importante conoscere queste limitazioni:

  1. Medicina: Il modello non è adatto a interpretare immagini mediche specialistiche come le TAC e non dovrebbe essere usato per consigli medici.

  2. Lingue diverse dall’inglese: Il modello non rende altrettanto bene con immagini che contengono testo in alfabeti non latini, come giapponese o coreano.

  3. Testo grande: Ingrandisci il testo nell’immagine per migliorarne la leggibilità, ma evita di ritagliare dettagli importanti.

  4. Rotazione: Il modello può interpretare in modo errato testo o immagini ruotati/capovolti.

  5. Elementi visivi: Il modello può avere difficoltà a capire grafici o testi in cui variano colori o stili come linee continue, tratteggiate o puntinate.

  6. Spazio: Il modello ha difficoltà con attività che richiedono una localizzazione spaziale precisa, come identificare le posizioni degli scacchi.

  7. Accuratezza: In alcuni scenari il modello può generare descrizioni o didascalie errate.

  8. Forma: Il modello ha difficoltà con immagini panoramiche e fisheye.

  9. Metadati e ridimensionamento: Il modello non elabora i nomi originali dei file né i metadati e le immagini vengono ridimensionate prima dell’analisi, influenzandone le dimensioni originali.

  10. Conteggio: Può fornire conteggi approssimativi degli oggetti nelle immagini.

Questo articolo è stato utile?