Что можно делать с данными в ChatGPT?
При анализе данных с помощью ChatGPT вы можете создавать статические и интерактивные таблицы и диаграммы на основе загруженных данных.
ChatGPT автоматически создаст интерактивный вид таблицы, позволяя прокручивать данные и просматривать все строки и столбцы.
После загрузки файла ChatGPT может определить оптимальный тип диаграммы для набора данных, либо вы можете указать один из поддерживаемых типов диаграмм в вашем запросе.
Вы можете настраивать оформление интерактивных диаграмм и создавать краткие выводы, объясняющие ваши результаты.
Используя модели рассуждения, вы можете выполнять задачи вроде запуска регрессий на тестовых данных, визуализации сложных бизнес-метрик и проведения сценарных симуляций.
Какие типы файлов поддерживаются?
ChatGPT может анализировать данные, загруженные в различных форматах, включая:
Excel (.xlsx)
CSV (.csv)
PDF (.pdf)
JSON
Также можно загружать последние версии файлов напрямую из:
Google Drive
Microsoft OneDrive Personal
Microsoft OneDrive, включая SharePoint
При подготовке таблиц к анализу в ChatGPT следуйте этим рекомендациям для наилучших результатов:
Рекомендуется:
Добавлять информативные заголовки столбцов в первой строке
Использовать простые формулировки для заголовков, избегая сокращений и жаргона
Использовать одну строку на одну запись
Не стоит:
Размещать несколько разделов и таблиц в одном файле
Оставлять пустые строки или столбцы
Вставлять изображения, содержащие критически важную информацию
Как ChatGPT анализирует и визуализирует данные с помощью диаграмм?
ChatGPT использует pandas для анализа данных и Matplotlib для создания как статических, так и интерактивных диаграмм. После того как ChatGPT проанализирует или визуализирует ваши данные, нажмите ссылку «View Analysis» в конце ответа, чтобы увидеть, как ChatGPT использовал эти инструменты:
Как сделать так, чтобы анализ отображался по умолчанию?
После того как ChatGPT проанализирует или визуализирует ваши данные, нажмите ссылку «View Analysis» в конце ответа.
В верхней части модального окна можно включить переключатель “Always show details”, чтобы окно анализа открывалось по умолчанию после каждого ответа.

Если вы хотите использовать код локально, нажмите “Copy”, чтобы скопировать код в буфер обмена, и вставьте его в редактор кода.
Как включить интерактивные диаграммы?
После построения диаграммы выберите "Switch to interactive chart" в правом верхнем углу графика.

После выбора этой опции график будет перерисован в интерактивную версию. Обратите внимание: интерактивны только некоторые типы диаграмм.
Вы можете вернуться к статической версии, выбрав "Switch to static chart" в правом верхнем углу графика.

Какие типы диаграмм интерактивны?
Сейчас в большинстве случаев интерактивны только столбчатые, круговые, точечные и линейные диаграммы.
ChatGPT может создавать и множество неинтерактивных диаграмм, включая: гистограммы, диаграммы рассеяния, box plot (диаграммы размаха, «ящик с усами»), тепловые карты, диаграммы областей, радарные диаграммы, treemap, пузырьковые и водопадные диаграммы.
Сколько файлов можно анализировать одновременно?
В один диалог можно загрузить до 10 файлов
К GPT можно прикрепить до 20 файлов как Knowledge (ChatGPT может работать с этими файлами, если на уровне GPT включена возможность Code Interpreter)
Какой объём данных можно анализировать?
512 МБ на файл. Для CSV-файлов или таблиц размер файла не должен превышать примерно 50 МБ — в зависимости от размера каждой строки.
Поэтому ChatGPT — хорошее решение для работы с файлами данных, которые слишком велики, чтобы открыть их в табличном приложении.
Как удалить загруженные файлы?
Файлы, загруженные в Advanced Data Analysis, удаляются через срок, который зависит от вашего плана. Если вы упираетесь в лимит использования файлов, вы также можете удалить файлы из недавних чатов или из любых GPT, которые вы создали, — лимиты у них общие.
Что происходит «под капотом»?
Когда вы загружаете структурированные данные, ChatGPT сначала просматривает первые несколько строк, чтобы понять схему и типы значений, которые могут встречаться.
Когда вы задаёте вопросы по своим данным, ChatGPT выполняет следующие шаги:
Получает доступ к загруженным данным в среде выполнения кода
Пишет код на Python для обработки данных и получения нужного аналитического результата
Выполняет код и изучает результаты
Встраивает результаты в ответ, который вы видите в окне чата
Именно способность ChatGPT одновременно писать и выполнять код позволяет ему делать сложные математические вычисления и применять методы статистического анализа. Если вы хотите посмотреть код, который сгенерировал ChatGPT, нажмите синюю ссылку [>_] в конце сообщения.
Откуда ChatGPT «знает», как анализировать данные?
Одна из ключевых возможностей ChatGPT — выполнять сложный анализ на основе запросов на естественном языке. Чтобы это работало, модели ChatGPT дополнительно дообучаются на большом объёме задач по анализу данных. После знакомства с примерами наборов данных, вопросами на естественном языке по этим наборам и кодом, который аналитики писали для ответов на такие вопросы, модель теперь может генерировать новый код для выполнения новых, ранее не встречавшихся анализов. Поэтому ChatGPT «знает», как использовать специализированные библиотеки Python для сложных задач.
Как ChatGPT выполняет код?
При анализе данных ChatGPT получает доступ к защищённой среде выполнения кода. Эта среда заранее содержит сотни библиотек Python, и ChatGPT умеет писать код для их импорта и использования. Среда имеет доступ к файлам, прикреплённым к запросу ChatGPT, что позволяет ей работать со структурированными данными, которые вы загружаете. Также среда может получать доступ к файлам, извлечённым с помощью GPT Actions.
Когда ChatGPT генерирует код в ответ на ваш запрос, он передаёт этот код в среду для выполнения. Затем он получает доступ к результатам выполнения, включая любые ошибки, которые выдал сгенерированный код. ChatGPT может интерпретировать ошибки и автоматически исправлять проблемы в сгенерированном коде.
Среда выполнения кода ChatGPT не может напрямую отправлять исходящие сетевые запросы. Выполнение кода также изолировано от остальной части платформы, на которой работает ChatGPT, что обеспечивает безопасность функции.
Когда ChatGPT впервые анализирует данные в рамках диалога, создаётся новый экземпляр среды выполнения кода. Этот экземпляр доступен только внутри соответствующего диалога и уничтожается в течение 13 часов после того, как диалог становится неактивным.
Какие есть применения помимо анализа данных?
Среда выполнения кода ChatGPT в первую очередь предназначена для работы со структурированными данными. Однако ключевые возможности функции (написание и выполнение кода, доступ к результатам выполнения) открывают широкий спектр применений помимо анализа данных.
Примеры:
Обработка и генерация файлов
Тематический анализ неструктурированных данных и текстовых документов
и т. д.
ChatGPT обучен на самых разных задачах программирования и может придумывать творческие способы использовать среду выполнения кода для решения задач.
