OpenAI
Эта страница была переведена машинным переводом. Открыть оригинальную статью на английском.

Извлечение инсайтов с помощью анализа данных в ChatGPT

Персональный AI-аналитик для бизнес-пользователей и опытных специалистов по данным

Обновлено: 2 days ago

Взаимодействие с таблицами в ChatGPT

Когда вы загружаете файл, ChatGPT автоматически создаёт интерактивное представление таблицы, позволяющее прокручивать данные и просматривать все строки и столбцы.

Data analysis table of San Francisco film locations with titles, release years, and locations

После загрузки файла вы можете задавать уточняющие вопросы, относящиеся к набору данных. В промптах не нужно указывать конкретные операции — команд на естественном языке, таких как «проанализируй» или «сравни», достаточно, чтобы ChatGPT выдал результаты.

ChatGPT data analysis table comparing weekday and weekend revenue, with weekday sales higher than weekend

Вы также можете создавать таблицы непосредственно в ChatGPT, попросив сгенерировать вывод в виде таблицы.

Image

Чтобы лучше рассмотреть данные, можно развернуть таблицу, нажав на две стрелки в правом верхнем углу таблицы:

ChatGPT data analysis table expand button with tooltip “Expand table”

В представлении таблицы можно выбрать конкретную строку или столбец и создать промпт, чтобы получить инсайты по выделенным данным. Например, здесь мы выбрали столбец и попросили найти элемент, который встречается чаще всего.

ChatGPT Data Analysis table with the Title column selected and a prompt asking which title appears most often

Несколько строк или столбцов можно выбрать, удерживая клавишу Command на Mac или Ctrl на Windows и нажимая нужные строки или столбцы. Несколько ячеек также можно выбрать, нажав на одну ячейку и перетащив указатель мыши, чтобы охватить нужную область.

ChatGPT answers the average of three selected spreadsheet cells as 79

После выбора нескольких элементов можно попросить ChatGPT вычислить значение или выполнить действие со значениями выбранных элементов. Например, можно выделить набор ячеек и попросить ChatGPT вычислить среднее значение.

Редактирование и создание таблиц с помощью ChatGPT

Вы можете загружать и редактировать существующие таблицы, предлагая ChatGPT внести изменения с помощью промпта. Например, можно с помощью промпта попросить ChatGPT обновить таблицу, добавив столбец со средними значениями.

ChatGPT Data Analysis table updated with a new Average column for each row

Вы можете с помощью промпта попросить ChatGPT внести конкретные изменения, выделив столбцы, строки или ячейки, на которых должны основываться обновления. Здесь мы выделили два столбца и запросили новый столбец в таблице, содержащий их суммы.

Data table with a new Friday + Saturday column summing the Friday and Saturday values

Вы можете скачать таблицу, созданную ChatGPT, нажав кнопку скачивания в правом верхнем углу таблицы. Обратите внимание, что скачанный файл будет в формате CSV.

Download table button in ChatGPT Data Analysis

Визуализация данных с помощью ChatGPT

После загрузки файла вы можете с помощью промпта попросить ChatGPT создать статическую диаграмму. Вы можете позволить ChatGPT определить идеальный тип диаграммы для набора данных или указать в промпте один из поддерживаемых типов: линейный график, столбчатая диаграмма, круговая диаграмма, гистограммы, точечная диаграмма, ящичные диаграммы (диаграммы «ящик с усами»), тепловые карты, диаграммы с областями, радарные диаграммы, древовидные карты, пузырьковые диаграммы и каскадные диаграммы.

Обратите внимание: в большинстве случаев сейчас интерактивными являются только столбчатые, круговые, точечные и линейные диаграммы.

Revenue by day of week line chart with Friday as the low point at 53

Если тип диаграммы не указан, ChatGPT сам определит оптимальный тип для вывода.

ChatGPT data analysis chart comparing total revenue for weekdays versus weekends

В правом верхнем углу диаграммы можно скачать её или увеличить размер. По умолчанию скачанные диаграммы имеют формат PNG.

Вы также можете изменять цвета диаграммы или включать и отключать её интерактивность. При изменении цветов можно выбрать один из цветов по умолчанию или ввести hex-код цвета.

Color settings panel with Dataset color set to blue and Interactive toggled on

Распространённые типы анализа

ChatGPT обучен выполнять различные задачи по анализу данных. Вот некоторые распространённые задачи:

Обнаружение и устранение аномалий

При принятии решений на основе данных важно убедиться, что исходные данные максимально точны. ChatGPT умеет выявлять данные, которые могут отсутствовать или быть неверными. Распространённые проблемы, которые ChatGPT может выявить и исправить:

  • Отсутствующие значения

  • Выбросы

  • Дублирующиеся строки

  • Неверные типы данных

Начните анализ с такого промпта: Проверь эти данные на распространённые проблемы.

После того как ChatGPT выявит распространённые проблемы, вы можете попросить его исправить их. В зависимости от обнаруженных проблем ChatGPT может предложить вам несколько вариантов на выбор. Если вы не уверены в последствиях такого выбора, попробуйте попросить ChatGPT предоставить больше информации.

Агрегация и интеграция

ChatGPT может агрегировать большие объёмы структурированных данных, чтобы помочь вам разобраться в информации. Вот некоторые виды агрегации, которые может выполнять ChatGPT:

  • Суммы

  • Средние значения (медиана, среднее, мода)

  • Минимальные и максимальные значения

  • Количество уникальных значений

  • Стандартное отклонение

Вы можете развернуть таблицу, выбрать один или несколько числовых столбцов, а затем использовать такой промпт: Рассчитай медиану и стандартное отклонение для этих данных.

ChatGPT также может объединять несколько наборов данных на основе общих идентификаторов.

Допустим, вы загружаете две таблицы: одну с клиентами, а другую с покупками. Записи о покупках связаны с записями о клиентах через свойство customer_id . ChatGPT знает, как интегрировать оба файла в единый набор данных, чтобы отвечать на вопросы вроде «Какова общая сумма всех покупок, совершённых клиентами с планом Gold?»

ChatGPT автоматически объединяет наборы данных, когда вы задаёте вопрос, для ответа на который это необходимо.

Расширенный статистический анализ

ChatGPT понимает, как выполнять широкий спектр статистических анализов, и может выбирать подходящие методы с учётом ваших требований. Вот некоторые виды анализа, которые может выполнять ChatGPT:

  • Сравнительная статистика: предполагает сравнение разных групп или переменных, чтобы понять их различия или сходства. К методам относятся t-тесты, ANOVA (дисперсионный анализ) и MANOVA (многомерный дисперсионный анализ).

  • Корреляционный и регрессионный анализ: эти методы оценивают связь между переменными. Корреляционный анализ измеряет силу и направление связи, а регрессионный анализ моделирует связь для прогнозирования результатов.

  • Анализ временных рядов: этот тип анализа изучает точки данных, собранные во времени, чтобы выявлять тренды, циклы и сезонные эффекты. Методы включают ARIMA (авторегрессионное интегрированное скользящее среднее) и сезонную декомпозицию.

Чтобы использовать эти методы, не обязательно быть специалистом по данным! Если вы не уверены, какой метод лучше всего подходит для ваших данных, попробуйте рассказать ChatGPT, что хотите понять, и попросите его порекомендовать оптимальный метод анализа. Если вы не уверены, как интерпретировать результаты анализа, попросите ChatGPT объяснить их вам. Эффективный промпт может быть таким: Есть ли в этом анализе что-то примечательное или необычное?

Была ли эта статья полезной?