OpenAI
此頁面由機器翻譯。查看原文英文文章

ChatGPT 圖像輸入常見問題

助你了解 ChatGPT 全新圖像輸入功能的指南,涵蓋如何有效使用,以及了解其限制

更新日期:16 days ago

甚麼是圖像輸入?它們在 ChatGPT 中如何運作?

ChatGPT 現已具備圖像功能,能理解和解讀你在對話中加入作為圖像輸入的圖片。

我應如何在對話中使用圖像輸入?

基本用法:先上載一張相片。你可以詢問圖片中的物件、分析文件,或探索視覺內容。之後亦可在後續對話中加入更多圖片,以深入或轉換討論方向。你可隨時再用新相片返回對話。

標註圖片:如想將注意力集中到特定區域,建議在上載前先用相片編輯標記工具處理你的圖片。這可引導 ChatGPT 聚焦於你認為重要的元素。

哪些方案可使用圖像輸入?

Plus 和 ChatGPT Enterprise。

哪些模型可接受圖像輸入?

所有 ChatGPT 模型都可接受圖像輸入。

哪些平台可使用圖像輸入?

所有平台均可使用,包括網頁版(chatgpt.com)及流動裝置(iOS/Android)。

我的圖片會被用來改進你們的模型嗎?

我們對內容(包括圖片)的使用方式,對每項產品都維持一致。

請參閱 你的資料如何用於改進模型表現,以更了解 ChatGPT 上的內容可如何用於改進模型表現,以及使用者有哪些選擇。

對於 ChatGPT Enterprise,我們不會使用內容來訓練模型。

我如何在 ChatGPT 中加入圖像輸入?

在提示詞區域點按 + 圖示,然後選擇 Add photos & files。另外,你也可將圖像檔案拖曳到文字區域,或貼上已複製到剪貼板的圖片。

圖像輸入支援影片嗎?

不支援,它不能處理影片。目前只支援處理靜態圖片。

支援哪些檔案類型?

PNG (.png)、JPEG (.jpeg 及 .jpg),以及非動畫 GIF (.gif)。

我一次可上載多少張圖片?

你可加入對話的圖片數量取決於多項因素,包括圖片大小及隨附文字的多少。一般而言,如你遇到問題,建議減少圖片數量或縮小圖片大小。

每張圖片的大小上限是多少?

20MB。

圖像功能如何處理含糊或不清晰的圖片?

如果圖片含糊或不清晰,模型會盡力作出解讀。不過,結果可能較不準確。

使用者在配合圖像輸入使用 ChatGPT 時,應留意哪些限制?

如果你正在使用 ChatGPT 全新的圖像輸入功能,請務必留意以下限制:

  1. 醫療:模型不適合解讀 CT 掃描等專業醫療影像,也不應用於提供醫療建議。

  2. 非英語:模型在處理含有非拉丁字母文字(例如日文或韓文)的圖片時,表現未如理想。

  3. 大文字:放大圖片中的文字可提升可讀性,但避免裁掉重要細節。

  4. 旋轉:模型可能會誤解旋轉/倒轉的文字或圖片。

  5. 視覺元素:當圖表或文字中的顏色或樣式(如實線、虛線或點線)有所不同時,模型可能難以理解。

  6. 空間:模型較難處理需要精確空間定位的任務,例如識別棋盤上的位置。

  7. 準確性:模型在某些情況下可能會產生不正確的描述或標題。

  8. 形狀:模型較難處理全景圖和魚眼圖片。

  9. 中繼資料與調整大小:模型不會處理原始檔名或中繼資料,而且圖片會在分析前調整大小,影響其原始尺寸。

  10. 計數:對圖片中的物件數量,可能只會給出約略估算。

這篇文章對你有幫助嗎?