OpenAI
此頁面由機器翻譯。查看原文英文文章

在 ChatGPT 中進行數據分析

在 ChatGPT 處理數據時使用的功能及能力

更新日期:3 days ago

你可以在 ChatGPT 用數據做甚麼?

使用 ChatGPT 分析數據時,你可以根據已上傳的數據建立靜態及互動表格與圖表。

  • ChatGPT 會自動建立互動表格檢視,讓你捲動瀏覽數據,查看所有列與欄。

  • 上傳檔案後,ChatGPT 可判斷最適合該數據集的圖表類型,或者你亦可在提示詞中指定我們支援的圖表類型。

  • 你可以自訂互動圖表的圖像呈現方式,並建立摘要說明你的發現。

  • 使用推理模型時,你可以執行例如對測試數據做回歸分析、將複雜業務指標視覺化,以及進行情境模擬等工作。

支援哪些檔案類型?

ChatGPT 可分析多種格式上傳的數據檔案,包括:

  • Excel (.xlsx)

  • 逗號分隔值 (.csv)

  • PDF (.pdf)

  • JSON

你亦可直接從以下來源上傳最新版本的檔案:

  • Google Drive

  • Microsoft OneDrive Personal

  • Microsoft OneDrive(包括 Sharepoint)

準備在 ChatGPT 中分析的試算表時,請遵循以下指引以獲得最佳結果:

建議:

  • 在第一列加入具描述性的欄標題

  • 欄標題使用淺白語言,避免縮寫及術語

  • 每列只放一筆記錄

避免:

  • 在同一試算表中加入多個區段及表格

  • 加入空白列或欄

  • 加入包含關鍵資訊的圖片

ChatGPT 如何用圖表分析及視覺化數據?

ChatGPT 會使用 pandas 分析你的數據,並使用 Matplotlib 根據你的數據建立靜態及互動圖表。使用 ChatGPT 分析或視覺化數據後,按一下回應末尾出現的「View Analysis」連結,即可查看 ChatGPT 如何使用這些工具:

View analysis tooltip in ChatGPT data analysis conversation

我如何預設查看分析內容?

使用 ChatGPT 分析或視覺化數據後,按一下回應末尾出現的「View Analysis」連結。

View analysis tooltip in ChatGPT data analysis chat

在彈出視窗頂部,你可以開啟「Always show details」,讓分析視窗在每次回應後預設顯示。

Image

如果你想在本機使用該程式碼,可以按一下「Copy」將程式碼複製到剪貼簿,再貼到你的程式碼編輯器。

如何啟用互動圖表?

產生圖表後,選取圖形右上角的 "Switch to interactive chart"。

ChatGPT chart controls with tooltip for switching to interactive chart

選取此選項後,圖形會重新繪製並更新為互動版本。請注意,只有有限種類的圖表支援互動功能。

你亦可選取圖形右上角的 "Switch to static chart",切換回靜態圖形。

Chart toolbar tooltip for switching to a static chart in ChatGPT data analysis

哪些圖表類型可互動?

目前在大多數情況下,只有長條圖、圓餅圖、散點圖及折線圖支援互動。

ChatGPT 亦可產生多種非互動圖表,包括:直方圖、散點圖、箱形圖(Box-and-Whisker Plots)、熱力圖、面積圖、雷達圖、樹狀圖、氣泡圖及瀑布圖。

我一次可以分析多少個檔案?

  • 每個對話最多可上傳 10 個檔案

  • 最多可將 20 個檔案附加到 GPT 作為 Knowledge(如在 GPT 層級啟用程式碼解譯器能力,ChatGPT 可與這些檔案互動)

我可以分析多少數據?

每個檔案 512 MB。對於 CSV 檔案或試算表,檔案大小不可超過約 50MB,實際視乎每列大小而定。

這讓 ChatGPT 成為處理過大、無法在試算表應用程式中開啟的數據檔案的理想方案。

如何刪除我上傳的檔案?

上傳至 Advanced Data Analysis 的檔案會在一段時間內刪除,實際時長取決於你的方案。如果你遇到檔案使用上限,也可以從最近聊天記錄或你建立的任何 GPT 中刪除檔案,因為它們共用上限。

底層運作原理是甚麼?

當你上傳結構化數據時,ChatGPT 會先檢視前幾列數據,以了解結構定義及可能存在的值類型。

當你就數據提出問題時,ChatGPT 會執行以下步驟:

  1. 在程式碼執行環境中存取已上傳的數據

  2. 撰寫 Python 程式碼以處理數據,並產生所需的分析輸出

  3. 執行程式碼並檢查結果

  4. 把結果整合到你在聊天視窗看到的回應中

ChatGPT 同時具備撰寫及執行程式碼的能力,因此能進行複雜的數學運算及統計分析技術。如果你想查看 ChatGPT 產生的程式碼,請按一下訊息末尾的藍色 [>_] 連結。

ChatGPT 如何知道怎樣分析數據?

ChatGPT 的核心能力之一,是根據自然語言提示詞進行複雜分析。為了實現這一點,ChatGPT 模型會以大量數據分析任務作後訓練。模型接觸過示例數據集、關於這些數據集的自然語言問題,以及數據分析師為回答這些問題所寫的程式碼後,現已能夠產生新程式碼以執行全新的分析。這就是為何 ChatGPT「知道」如何使用專門的 Python 程式庫來執行複雜任務。

ChatGPT 如何執行程式碼?

分析數據時,ChatGPT 可存取安全的程式碼執行環境。該環境預先載入數百個 Python 程式庫,而 ChatGPT 知道如何撰寫程式碼以匯入及使用這些程式庫。該環境可存取附加到 ChatGPT 提示詞的檔案,讓它能與你上傳的結構化數據互動。環境亦可存取使用 GPT Actions 擷取的檔案。

當 ChatGPT 回應你的提示詞而產生程式碼時,會把該程式碼交給環境執行。之後它便可存取環境輸出,包括產生的程式碼所導致的任何錯誤。ChatGPT 能夠解讀錯誤,並自動解決所產生程式碼中的問題。

ChatGPT 的程式碼執行環境不能直接發出對外網絡請求。程式碼執行亦與 ChatGPT 託管平台其餘部分隔離,以確保此功能安全。

當 ChatGPT 在對話中首次分析數據時,系統會建立一個新的程式碼執行環境實例。此實例只可在相關對話內存取,並會在對話停止活動後 13 小時內銷毀。

除了數據分析之外,還有甚麼應用?

ChatGPT 的程式碼執行環境主要為與結構化數據互動而設。不過,此功能的核心能力(撰寫及執行程式碼、存取程式碼執行輸出)令它在數據分析以外亦可應用於多種情境。

應用包括:

  • 檔案處理及產生

  • 對非結構化數據及文字文件進行主題分析

  • 等等。

ChatGPT 曾接受各類編碼任務訓練,因此能想出具創意的方法,利用程式碼執行環境完成工作。

這篇文章對你有幫助嗎?