OpenAI
このページは機械翻訳されています。元の英語の記事を表示

ChatGPT データ分析でインサイトを抽出

ビジネスユーザーと経験豊富なデータ専門家のためのパーソナル AI アナリスト

更新日: 8 days ago

ChatGPT でのテーブル操作

ファイルをアップロードすると、ChatGPT は自動的にインタラクティブなテーブルビューを作成します。これにより、データをスクロールして、すべての行と列を表示できます。

Data analysis table of San Francisco film locations with titles, release years, and locations

ファイルがアップロードされたら、データセットに関する追加の質問を続けて行うことができます。プロンプトで特定の操作を指定する必要はありません。「分析」や「比較」のような自然言語のコマンドで、ChatGPT から結果を得るには十分です。

ChatGPT data analysis table comparing weekday and weekend revenue, with weekday sales higher than weekend

出力をテーブルとして生成するよう依頼することで、ChatGPT 内で直接テーブルを作成することもできます。

Image

データをより詳しく見るには、テーブルの右上隅にある 2 つの矢印をクリックしてテーブルを展開できます。

ChatGPT data analysis table expand button with tooltip “Expand table”

テーブルビューでは、特定の行または列を選択し、ハイライトされたデータに関するインサイトを得るためのプロンプトを作成できます。たとえば、ここでは列を選択し、最も頻繁に出現する項目を尋ねています。

ChatGPT Data Analysis table with the Title column selected and a prompt asking which title appears most often

複数の行または列を選択するには、Mac では Command キー、Windows では Ctrl キーを押したまま、行または列をクリックします。複数のセルを選択するには、1 つのセルをクリックし、目的の範囲を覆うようにマウスをドラッグします。

ChatGPT answers the average of three selected spreadsheet cells as 79

複数の項目を選択した後、ChatGPT に選択した値の計算や操作の実行を依頼できます。たとえば、一連のセルをハイライトして、ChatGPT に平均値の計算を依頼できます。

ChatGPT によるテーブルの編集と作成

既存のテーブルをアップロードし、ChatGPT に更新を依頼するプロンプトを入力して編集できます。たとえば、平均値を含む列でテーブルを更新するよう ChatGPT に指示できます。

ChatGPT Data Analysis table updated with a new Average column for each row

更新の基準にしたい列、行、セルをハイライトして、ChatGPT に具体的な変更を依頼できます。ここでは、2 つの列をハイライトし、それらの合計を含む新しい列をテーブルに追加するよう依頼しています。

Data table with a new Friday + Saturday column summing the Friday and Saturday values

テーブルの右上隅にあるダウンロードボタンをクリックすると、ChatGPT が生成したテーブルをダウンロードできます。ダウンロードされるファイルは CSV 形式です。

Download table button in ChatGPT Data Analysis

ChatGPT によるデータの可視化

ファイルをアップロードした後、ChatGPT にプロンプトを入力して静的なグラフを作成できます。ChatGPT にデータセットに最適なグラフの種類を判断させることも、プロンプトでサポートされているグラフの種類を指定することもできます。折れ線グラフ、棒グラフ、円グラフ、ヒストグラム、散布図、箱ひげ図、ヒートマップ、面グラフ、レーダーチャート、ツリーマップ、バブルチャート、ウォーターフォールチャートに対応しています。

現在、ほとんどの場合でインタラクティブに操作できるのは、棒グラフ、円グラフ、散布図、折れ線グラフのみです。

Revenue by day of week line chart with Friday as the low point at 53

グラフの種類を指定しない場合、ChatGPT が出力に最適なグラフの種類を判断します。

ChatGPT data analysis chart comparing total revenue for weekdays versus weekends

グラフの右上隅で、グラフをダウンロードしたりサイズを拡大したりできます。ダウンロードされるグラフは、デフォルトでは PNG 形式です。

グラフの色を編集したり、インタラクティブ機能のオン/オフを切り替えたりすることもできます。色を変更する際は、デフォルトの色から 1 つを選択するか、色の 16 進コードを入力できます。

Color settings panel with Dataset color set to blue and Interactive toggled on

一般的な分析の種類

ChatGPT は、さまざまなデータ分析タスクを実行できるようにトレーニングされています。一般的なタスクには、次のようなものがあります。

異常検出と軽減

データに基づいて意思決定を行う際は、元データをできるだけ正確に保つことが重要です。ChatGPT は、欠損している可能性や誤っている可能性のあるデータを特定できます。ChatGPT が特定して修正できる一般的な問題には、次のようなものがあります。

  • 欠損値

  • 外れ値

  • 重複行

  • 誤ったデータ型

次のようなプロンプトで分析を開始します。このデータに一般的な問題がないか確認してください。

ChatGPT が一般的な問題を特定したら、それらの問題の修正を依頼できます。発生した問題に応じて、ChatGPT は選択できる複数のオプションを提示する場合があります。これらの選択肢の影響が不明な場合は、ChatGPT に詳細情報を尋ねてみてください。

集計と統合

ChatGPT は大量の構造化データを集計し、情報の理解に役立てることができます。ChatGPT が実行できる集計には、次のようなものがあります。

  • 合計

  • 平均値(中央値、算術平均、最頻値)

  • 最小値と最大値

  • 一意の値の数

  • 標準偏差

テーブルを展開して 1 つ以上の数値列を選択し、次のようなプロンプトを使用できます。このデータの中央値と標準偏差を計算してください。

ChatGPT は、共通の識別子に基づいて複数のデータセットを結合することもできます。

たとえば、customers を含むスプレッドシートと、purchases を含むスプレッドシートの 2 つをアップロードするとします。Purchase レコードは、customer_id プロパティを介して customer レコードに関連付けられています。ChatGPT は両方のファイルを 1 つのデータセットに統合する方法を理解しているため、「ゴールドプランの顧客による購入総額はいくらですか?のような質問に答えることができます。

ChatGPT は、必要な質問をしたときにデータセットを自動的に結合します。

高度な統計分析

ChatGPT は多様な統計分析の実行方法を理解しており、要件に基づいて適切な手法を選択できます。ChatGPT が実行できる分析の種類には、次のようなものがあります。

  • 比較統計: 異なるグループや変数を比較して、その違いや類似点を理解する分析です。手法には、t 検定、ANOVA(分散分析)、MANOVA(多変量分散分析)などがあります。

  • 相関分析と回帰分析: これらの手法は、変数間の関係を評価します。相関分析は関係の強さと方向を測定し、回帰分析は結果を予測するために関係をモデル化します。

  • 時系列分析: この種類の分析では、時間の経過とともに収集されたデータポイントを調べ、トレンド、周期、季節性の影響を特定します。手法には、ARIMA(自己回帰和分移動平均)や季節分解などがあります。

これらの手法を使うのに、データサイエンティストである必要はありません。どの手法が自分のデータに最も適しているかわからない場合は、理解したいことを ChatGPT に伝え、最適な分析手法を推奨してもらってください。分析結果の解釈方法がわからない場合は、ChatGPT に説明を依頼してください。効果的なプロンプトの例:この分析について、注目すべき点や通常と異なる点はありますか?

この記事は役に立ちましたか?