OpenAI
このページは機械翻訳されています。元の英語の記事を表示

ChatGPTでのデータ分析

ChatGPTでデータを扱う際に使用する機能とできること

更新日: 8 days ago

ChatGPTでデータを使って何ができますか?

ChatGPTでデータを分析すると、アップロードしたデータから静的およびインタラクティブな表やグラフを作成できます。

  • ChatGPTは自動的にインタラクティブな表ビューを作成し、データをスクロールしてすべての行と列を確認できるようにします。

  • ファイルをアップロードすると、ChatGPTがデータセットに最適なグラフ種類を判断できます。あるいは、プロンプトでサポートされているグラフ種類のいずれかを指定することもできます。

  • インタラクティブなグラフの見た目をカスタマイズしたり、得られた内容を説明する要約を作成したりできます。

  • 推論モデルを使うことで、テストデータに対する回帰分析の実行、複雑なビジネス指標の可視化、シナリオベースのシミュレーションなどのタスクを行えます。

どのファイル形式がサポートされていますか?

ChatGPTは、次のようなさまざまな形式でアップロードされたデータを分析できます。

  • Excel(.xlsx)

  • カンマ区切り値(.csv)

  • PDF(.pdf)

  • JSON

また、次のサービスから最新のファイルバージョンを直接アップロードすることもできます。

  • Google Drive

  • Microsoft OneDrive Personal

  • SharePoint を含む Microsoft OneDrive

ChatGPTでスプレッドシートを分析用に準備する際は、最良の結果を得るために次のガイドラインに従ってください。

推奨:

  • 1行目に分かりやすい列見出しを入れる

  • 列見出しには略語や専門用語を避け、平易な表現を使う

  • 1レコードにつき1行にする

非推奨:

  • 1つのスプレッドシートに複数のセクションや表を含める

  • 空の行や列を含める

  • 重要な情報を含む画像を入れる

ChatGPTはどのようにデータを分析し、グラフで可視化しますか?

ChatGPTはpandasを使ってデータを分析し、Matplotlibを使ってデータから静的およびインタラクティブなグラフを作成します。ChatGPTでデータの分析や可視化を行った後、回答の末尾に表示される「View Analysis」リンクをクリックすると、ChatGPTがこれらのツールをどのように使ったかを確認できます。

View analysis tooltip in ChatGPT data analysis conversation

分析をデフォルトで表示するにはどうすればよいですか?

ChatGPTでデータの分析や可視化を行った後、回答の末尾に表示される「View Analysis」リンクをクリックしてください。

View analysis tooltip in ChatGPT data analysis chat

モーダルの上部で「Always show details」をオンにすると、以後は各回答の後に分析ウィンドウがデフォルトで表示されます。

Image

コードをローカルで使用したい場合は、「Copy」をクリックしてコードをクリップボードにコピーし、コードエディタに貼り付けてください。

インタラクティブなグラフを有効にするにはどうすればよいですか?

グラフを生成した後、グラフ右上の「Switch to interactive chart」を選択します。

ChatGPT chart controls with tooltip for switching to interactive chart

このオプションを選択すると、グラフが再レンダリングされ、インタラクティブ版に更新されます。インタラクティブに対応しているグラフ種類は限られている点にご注意ください。

静的グラフに戻すには、グラフ右上の「Switch to static chart」を選択します。

Chart toolbar tooltip for switching to a static chart in ChatGPT data analysis

どのグラフ種類がインタラクティブですか?

現在、ほとんどの場合、棒グラフ、円グラフ、散布図、折れ線グラフのみがインタラクティブに対応しています。

ChatGPTは、ヒストグラム、散布図、箱ひげ図(ボックス・アンド・ウィスカー・プロット)、ヒートマップ、面グラフ、レーダーチャート、ツリーマップ、バブルチャート、ウォーターフォールチャートなど、さまざまな非インタラクティブなグラフも作成できます。

同時に分析できるファイル数はいくつですか?

  • 1つの会話につき最大10ファイルをアップロードできます

  • GPTに「知識(Knowledge)」として最大20ファイルを添付できます(GPTレベルでCode Interpreter機能が有効になっている場合、ChatGPTはこれらのファイルとやり取りできます)

分析できるデータ量はどれくらいですか?

ファイルあたり512MB。CSVファイルまたはスプレッドシートの場合、各行のサイズに応じて、ファイルサイズはおおむね50MBを超えない必要があります。

そのためChatGPTは、スプレッドシートアプリケーションでは開けないほど大きいデータファイルを扱うのに適したソリューションです。

アップロードしたファイルを削除するにはどうすればよいですか?

高度なデータ分析にアップロードされたファイルは、ご利用のプランに応じて削除までの期間が異なります。ファイル使用量の上限に達しそうな場合は、最近のチャット、または自分で作成した任意のGPTからファイルを削除することもできます(これらは上限を共有します)。

内部では何が行われていますか?

構造化データをアップロードすると、ChatGPTはまず最初の数行を確認し、スキーマや存在し得る値の型を把握します。

データについて質問すると、ChatGPTは次の手順を実行します。

  1. コード実行環境でアップロードされたデータにアクセスする

  2. データを処理し、必要な分析結果を生成するPythonコードを書く

  3. コードを実行し、結果を確認する

  4. 結果を統合して、チャットウィンドウに表示される回答として提示する

複雑な数学的処理や統計分析手法を実行できるのは、ChatGPTがコードを「書く」だけでなく「実行」もできるためです。ChatGPTが生成したコードを確認したい場合は、メッセージ末尾の青い[>_]リンクをクリックしてください。

ChatGPTはどうやってデータ分析の方法を知っているのですか?

ChatGPTの中核的な機能の1つは、自然言語のプロンプトに基づいて複雑な分析を行えることです。これを実現するため、ChatGPTモデルは大量のデータ分析タスクで追加学習(ポストトレーニング)されています。例示データセット、それらに関する自然言語の質問、そしてデータアナリストがそれらに答えるために書いたコードに触れることで、モデルは新しい分析を行うための新規コードを生成できるようになりました。これが、ChatGPTが複雑なタスクを実行するための専門的なPythonライブラリの使い方を「知っている」理由です。

ChatGPTはどのようにコードを実行しますか?

データを分析する際、ChatGPTは安全なコード実行環境にアクセスします。この環境には数百のPythonライブラリがあらかじめ読み込まれており、ChatGPTはそれらをインポートして使うコードを書くことができます。環境はChatGPTのプロンプトに添付されたファイルにアクセスできるため、アップロードした構造化データとやり取りできます。また、GPT Actionsを使って取得したファイルにもアクセスできます。

ChatGPTがプロンプトに応じてコードを生成すると、そのコードを実行のために環境へ渡します。その後、生成されたコードによるエラーを含む、環境の出力にアクセスできます。ChatGPTはエラーを解釈し、生成したコードの問題を自動的に解決できます。

ChatGPTのコード実行環境は、直接の外向きネットワークリクエストを生成できません。コード実行はChatGPTのホスティングプラットフォームの他の部分からも分離されており、機能の安全性を確保しています。

会話中にChatGPTが初めてデータ分析を行う際、新しいコード実行環境のインスタンスが生成されます。このインスタンスは関連する会話内からのみアクセス可能で、会話が非アクティブになってから13時間以内に破棄されます。

データ分析以外にはどのような用途がありますか?

ChatGPTのコード実行環境は、主に構造化データとのやり取りを目的として設計されています。ただし、この機能の中核(コードを書いて実行すること、コード実行の出力にアクセスすること)により、データ分析以外にも幅広い用途が可能です。

例:

  • ファイルの編集・生成

  • 非構造化データやテキスト文書のテーマ分析

  • など

ChatGPTはさまざまなコーディングタスクで学習されており、コード実行環境を使ってタスクを達成するための創造的な方法を考え出すことができます。

この記事は役に立ちましたか?