OpenAI
此頁面由機器翻譯。查看原始英文文章

使用 ChatGPT 進行資料分析

在 ChatGPT 中處理資料時使用的功能與能力

更新日期:6 hours ago

在 ChatGPT 中,你可以用資料做什麼?

使用 ChatGPT 分析資料時,你可以根據上傳的資料建立靜態與互動式的表格和圖表。

  • ChatGPT 會自動建立互動式表格檢視,讓你可以捲動瀏覽資料,並查看所有列與欄。

  • 上傳檔案後,ChatGPT 可以為資料集判斷最適合的圖表類型;你也可以在提示中指定我們支援的圖表類型之一。

  • 你可以自訂互動式圖表的視覺呈現,並撰寫摘要來說明你的發現。

  • 使用推理模型,你可以執行例如在測試資料上跑迴歸、視覺化複雜的商業指標,以及進行情境式模擬等任務。

支援哪些檔案類型?

ChatGPT 可分析多種檔案格式上傳的資料,包括:

  • Excel (.xlsx)

  • 逗號分隔值 (.csv)

  • PDF (.pdf)

  • JSON

你也可以直接從以下來源上傳最新版本的檔案:

  • Google Drive

  • Microsoft OneDrive 個人版

  • 包含 Sharepoint 的 Microsoft OneDrive

在準備要在 ChatGPT 中分析的試算表時,請遵循以下指引以獲得最佳結果:

建議:

  • 在第一列加入具描述性的欄位標題

  • 欄位標題使用一般用語,避免縮寫與行話

  • 每筆記錄使用一列

不建議:

  • 在單一試算表中包含多個區段與表格

  • 包含空白列或空白欄

  • 包含承載關鍵資訊的圖片

ChatGPT 如何用圖表分析並視覺化資料?

ChatGPT 使用 pandas 分析你的資料,並使用 Matplotlib 以你的資料建立靜態與互動式圖表。在使用 ChatGPT 分析或視覺化你的資料後,點擊回覆末尾出現的「查看分析」連結,即可查看 ChatGPT 如何使用這些工具:

View analysis tooltip in ChatGPT data analysis conversation

我如何預設看到分析內容?

在使用 ChatGPT 分析或視覺化你的資料後,點擊回覆末尾出現的「查看分析」連結。

View analysis tooltip in ChatGPT data analysis chat

在彈出視窗的頂端,你可以將「一律顯示詳細內容」切換為開啟,讓每次回覆後預設顯示分析視窗。

Image

如果你想在本機使用程式碼,可以點擊「複製」將程式碼複製到剪貼簿,並貼到你的程式碼編輯器中。

如何啟用互動式圖表?

產生圖表後,在圖表右上角選擇 "Switch to interactive chart"。

ChatGPT chart controls with tooltip for switching to interactive chart

選取此選項後,圖表會重新渲染並更新為互動版本。請注意:只有有限的圖表類型支援互動。

你也可以在圖表右上角選擇 "Switch to static chart",切換回靜態圖表。

Chart toolbar tooltip for switching to a static chart in ChatGPT data analysis

哪些圖表類型是互動式的?

目前在大多數情況下,只有長條圖、圓餅圖、散點圖與折線圖支援互動。

ChatGPT 也能產生多種非互動式圖表,包括:直方圖、散點圖、盒鬚圖(Box-and-Whisker Plots)、熱圖、面積圖、雷達圖、樹狀圖(treemaps)、氣泡圖,以及瀑布圖。

一次可以分析多少個檔案?

  • 在單一對話中最多可上傳 10 個檔案

  • 最多可將 20 個檔案附加到某個 GPT 作為 Knowledge(若在 GPT 層級啟用了程式碼解讀器能力,ChatGPT 可與這些檔案互動)

可以分析多少資料量?

每個檔案 512 MB。對於 CSV 檔或試算表,檔案大小不可超過約 50MB,具體取決於每列的大小。

因此,對於大到無法用試算表應用程式開啟的資料檔案,ChatGPT 是不錯的解決方案。

如何刪除我上傳的檔案?

上傳到進階資料分析的檔案會在一段時間內刪除,刪除時間會依你的方案而有所不同。如果你遇到檔案使用上限,也可以從最近的聊天或你建立的任何 GPT 中刪除檔案,因為它們共用上限。

背後是怎麼運作的?

當你上傳結構化資料時,ChatGPT 會先檢視前幾列資料,以了解資料架構以及可能存在的值型別。

當你針對資料提問時,ChatGPT 會執行以下步驟:

  1. 在程式碼執行環境中存取上傳的資料

  2. 撰寫 Python 程式碼來處理資料,並產生所需的分析輸出

  3. 執行程式碼並檢視結果

  4. 將結果整合到你在聊天視窗看到的回覆中

正是因為 ChatGPT 能同時撰寫並執行程式碼,才得以進行複雜的數學運算與統計分析技術。若你想檢視 ChatGPT 產生的程式碼,請點擊訊息末尾的藍色 [>_] 連結。

ChatGPT 如何知道要怎麼分析資料?

ChatGPT 的核心能力之一,是能根據自然語言提示進行複雜分析。為了達成這點,ChatGPT 模型在後訓練階段使用大量資料分析任務進行訓練。在接觸到範例資料集、針對這些資料集的自然語言問題,以及資料分析師為回答這些問題所撰寫的程式碼後,模型便能產生新的程式碼來執行全新的分析。這也是為什麼 ChatGPT「知道」如何使用專門的 Python 程式庫來完成複雜任務。

ChatGPT 如何執行程式碼?

分析資料時,ChatGPT 可存取一個安全的程式碼執行環境。該環境預先載入了數百個 Python 程式庫,而 ChatGPT 知道如何撰寫程式碼來匯入並使用這些程式庫。該環境可存取附加在 ChatGPT 提示中的檔案,讓它能與你上傳的結構化資料互動。該環境也能存取透過 GPT Actions 擷取的檔案。

當 ChatGPT 根據你的提示產生程式碼時,它會將程式碼交給環境執行。接著它可存取環境輸出,包括由產生的程式碼所導致的任何錯誤。ChatGPT 能解讀錯誤並自動修正產生程式碼中的問題。

ChatGPT 的程式碼執行環境無法直接產生對外的網路請求。程式碼執行也與 ChatGPT 託管平台的其他部分隔離,以確保此功能的安全性。

當 ChatGPT 在一段對話中第一次分析資料時,會建立一個新的程式碼執行環境實例。此實例僅能在相關對話中存取,並會在對話閒置 13 小時內遭到銷毀。

資料分析以外還有哪些應用?

ChatGPT 的程式碼執行環境主要是為了與結構化資料互動而設計。不過,此功能的核心能力(撰寫與執行程式碼、存取程式碼執行的輸出)也能支援許多資料分析以外的應用。

應用包括:

  • 檔案處理與產生

  • 對非結構化資料與文字文件進行主題分析

  • 等等。

ChatGPT 受過各種程式設計任務訓練,並能想出有創意的方法,運用程式碼執行環境來完成工作。

這篇文章有幫助嗎?