OpenAI
此頁面由機器翻譯。查看原文英文文章

利用 ChatGPT 數據分析提取洞察

為商業用戶和資深數據專業人士而設的個人 AI 分析師

更新日期:2 minutes ago

在 ChatGPT 中與表格互動

上載檔案時,ChatGPT 會自動建立互動式表格檢視,讓你捲動瀏覽資料並查看所有列和欄。

Data analysis table of San Francisco film locations with titles, release years, and locations

檔案上載後,你可以就該資料集提出後續問題。提示詞無需指定特定操作;使用「分析」或「比較」等自然語言指令,已足以讓 ChatGPT 產生結果。

ChatGPT data analysis table comparing weekday and weekend revenue, with weekday sales higher than weekend

你亦可以要求以表格形式產生輸出,直接在 ChatGPT 中建立表格。

Image

如要更清楚查看資料,你可以按一下表格右上角的兩個箭嘴來展開表格:

ChatGPT data analysis table expand button with tooltip “Expand table”

在表格檢視中,你可以選取特定列或欄,並建立提示詞以取得醒目標示資料的深入見解。例如,在這裡我們選取了一欄,並詢問出現次數最多的項目。

ChatGPT Data Analysis table with the Title column selected and a prompt asking which title appears most often

如要選取多列或多欄,可在 Mac 上按住 Command 鍵,或在 Windows 上按住 Ctrl 鍵,然後按一下列或欄。你亦可以按住一個儲存格並拖曳滑鼠覆蓋目標範圍,以選取多個儲存格。

ChatGPT answers the average of three selected spreadsheet cells as 79

選取多個項目後,你可以要求 ChatGPT 對所選值計算某個數值或執行動作。例如,你可以醒目標示一組儲存格,並要求 ChatGPT 計算平均值。

使用 ChatGPT 編輯和建立表格

你可以上載現有表格,並透過提示 ChatGPT 作出更新來編輯表格。例如,你可以提示 ChatGPT 更新表格,加入一個包含平均值的欄。

ChatGPT Data Analysis table updated with a new Average column for each row

你可以醒目標示想作為更新依據的欄、列或儲存格,以提示 ChatGPT 作出特定變更。在這裡,我們醒目標示了其中兩欄,並要求在表格中新增一欄,包含它們的總和。

Data table with a new Friday + Saturday column summing the Friday and Saturday values

你可以按一下表格右上角的下載按鈕,下載 ChatGPT 產生的表格。請注意,下載的檔案將採用 CSV 格式。

Download table button in ChatGPT Data Analysis

使用 ChatGPT 視覺化你的資料

上載檔案後,你可以提示 ChatGPT 產生靜態圖表。你可以讓 ChatGPT 判斷最適合該資料集的圖表類型,或在提示詞中指定我們支援的圖表類型之一:折線圖、長條圖、圓形圖、直方圖、散點圖、箱形圖(盒鬚圖)、熱度圖、面積圖、雷達圖、樹狀圖、氣泡圖和瀑布圖。

請注意,目前在大多數情況下,只有長條圖、圓形圖、散點圖和折線圖具互動功能。

Revenue by day of week line chart with Friday as the low point at 53

如果未指定圖表類型,ChatGPT 會判斷最適合輸出的圖表類型。

ChatGPT data analysis chart comparing total revenue for weekdays versus weekends

在圖表右上角,你可以下載或展開圖表大小。根據預設,下載的圖表會採用 PNG 格式。

你亦可以編輯圖表顏色,或開啟或關閉其互動功能。更改顏色時,你可以選取我們的預設顏色之一,或輸入顏色的十六進制代碼。

Color settings panel with Dataset color set to blue and Interactive toggled on

常見分析類型

ChatGPT 經過訓練,可執行各種資料分析任務。一些常見任務包括:

異常偵測與緩解

使用資料作決策時,務必確保來源資料盡可能準確。ChatGPT 知道如何識別可能缺失或不正確的資料。ChatGPT 可以識別並修復的常見問題包括:

  • 缺失值

  • 離群值

  • 重複列

  • 不正確的資料類型

你可以用類似這樣的提示詞開始分析:檢查這些資料是否有常見問題。

ChatGPT 識別出常見問題後,你可以要求它修復這些問題。視乎遇到的問題,ChatGPT 可能會提供多個選項讓你選擇。如果你不確定這些選擇的影響,可以嘗試向 ChatGPT 查詢更多資訊。

匯總與整合

ChatGPT 可以匯總大量結構化資料,協助你理解資訊。ChatGPT 可以執行的匯總包括:

  • 總和

  • 平均值(中位數、算術平均數、眾數)

  • 最小值和最大值

  • 不同值的計數

  • 標準差

你可以展開表格並選取一個或多個數值欄,然後使用類似這樣的提示詞:計算這些資料的中位數和標準差。

ChatGPT 亦可以根據共用識別碼合併多個資料集。

假設你上載兩份試算表,一份包含客戶,另一份包含購買記錄購買記錄會透過 customer_id 屬性與客戶記錄關聯。ChatGPT 知道如何將兩個檔案整合成單一資料集,以便回答「黃金方案客戶的所有購買總額是多少?

當你提出需要合併資料集的問題時,ChatGPT 會自動為你合併資料集。

進階統計分析

ChatGPT 了解如何執行各種統計分析,並能根據你的需求選擇合適技術。ChatGPT 可以執行的分析類型包括:

  • 比較統計:這涉及比較不同群組或變數,以了解其差異或相似之處。技術包括 t 檢定、ANOVA(變異數分析)和 MANOVA(多變量變異數分析)。

  • 相關與迴歸分析:這些方法評估變數之間的關係。相關分析衡量關係的強度和方向,而迴歸分析則建立關係模型以預測結果。

  • 時間序列分析:這類分析會檢視隨時間收集的資料點,以識別趨勢、週期和季節性影響。方法包括 ARIMA(自迴歸整合移動平均)和季節性分解。

你無需是資料科學家,也能使用這些技術!如果你不確定哪項技術最適合你的資料,可以嘗試告訴 ChatGPT 你想了解甚麼,並請它建議最佳分析技術。如果你不確定如何解讀分析輸出,可以請 ChatGPT 向你解釋。有效的提示詞可以是:這項分析有沒有任何值得注意或異常之處?

這篇文章對你有幫助嗎?