OpenAI
Trang này được dịch bằng máy học. Xem bài viết gốc bằng tiếng Anh.

Trích xuất insight với tính năng Phân tích dữ liệu của ChatGPT

Một chuyên gia phân tích AI cá nhân cho người dùng doanh nghiệp và chuyên gia dữ liệu giàu kinh nghiệm

Đã cập nhật: 4 days ago

Tương tác với bảng trong ChatGPT

Khi bạn tải tệp lên, ChatGPT sẽ tự động tạo chế độ xem bảng tương tác cho phép bạn cuộn qua dữ liệu và xem tất cả các hàng và cột.

Data analysis table of San Francisco film locations with titles, release years, and locations

Sau khi tệp được tải lên, bạn có thể đặt thêm các câu hỏi liên quan đến tập dữ liệu. Các câu lệnh không cần nêu rõ thao tác cụ thể — những lệnh ngôn ngữ tự nhiên như “phân tích” hoặc “so sánh” là đủ để ChatGPT tạo ra kết quả.

ChatGPT data analysis table comparing weekday and weekend revenue, with weekday sales higher than weekend

Bạn cũng có thể tạo bảng trực tiếp trong ChatGPT bằng cách yêu cầu đầu ra được tạo dưới dạng bảng.

Image

Để xem dữ liệu rõ hơn, bạn có thể mở rộng bảng bằng cách nhấp vào hai mũi tên ở góc trên bên phải của bảng:

ChatGPT data analysis table expand button with tooltip “Expand table”

Trong chế độ xem bảng, bạn có thể chọn một hàng hoặc cột cụ thể và tạo câu lệnh để lấy insight về phần dữ liệu được tô sáng. Ví dụ: ở đây chúng tôi đã chọn một cột và hỏi mục xuất hiện thường xuyên nhất.

ChatGPT Data Analysis table with the Title column selected and a prompt asking which title appears most often

Bạn có thể chọn nhiều hàng hoặc cột bằng cách nhấn giữ phím Command trên Mac hoặc phím Ctrl trên Windows rồi nhấp vào các hàng hoặc cột. Bạn cũng có thể chọn nhiều ô bằng cách nhấp vào một ô rồi kéo chuột để bao phủ vùng mong muốn.

ChatGPT answers the average of three selected spreadsheet cells as 79

Sau khi chọn nhiều mục, bạn có thể yêu cầu ChatGPT tính toán một giá trị hoặc thực hiện một hành động trên các giá trị đã chọn. Ví dụ: bạn có thể tô sáng một nhóm ô và yêu cầu ChatGPT tính giá trị trung bình.

Chỉnh sửa và tạo bảng với ChatGPT

Bạn có thể tải lên và chỉnh sửa các bảng hiện có bằng cách yêu cầu ChatGPT thực hiện cập nhật. Ví dụ: bạn có thể yêu cầu ChatGPT cập nhật một bảng bằng cách thêm một cột chứa các giá trị trung bình.

ChatGPT Data Analysis table updated with a new Average column for each row

Bạn có thể yêu cầu ChatGPT thực hiện các thay đổi cụ thể bằng cách tô sáng các cột, hàng hoặc ô mà bạn muốn dùng làm cơ sở cập nhật. Ở đây, chúng tôi đã tô sáng hai cột và yêu cầu thêm một cột mới vào bảng chứa tổng của chúng.

Data table with a new Friday + Saturday column summing the Friday and Saturday values

Bạn có thể tải xuống bảng do ChatGPT tạo ra bằng cách nhấp vào nút tải xuống ở góc trên bên phải của bảng. Xin lưu ý rằng tệp được tải xuống sẽ ở định dạng CSV.

Download table button in ChatGPT Data Analysis

Trực quan hóa dữ liệu của bạn với ChatGPT

Sau khi tải tệp lên, bạn có thể yêu cầu ChatGPT tạo biểu đồ tĩnh. Bạn có thể để ChatGPT xác định loại biểu đồ phù hợp nhất cho tập dữ liệu hoặc chỉ định một trong các loại biểu đồ được hỗ trợ trong câu lệnh: biểu đồ đường, biểu đồ cột, biểu đồ tròn, biểu đồ tần suất, biểu đồ phân tán, biểu đồ hộp (Box-and-Whisker Plots), bản đồ nhiệt, biểu đồ miền, biểu đồ radar, treemap, biểu đồ bong bóng và biểu đồ thác nước.

Xin lưu ý rằng hiện tại trong đa số trường hợp chỉ có biểu đồ cột, tròn, phân tán và đường là có tính tương tác.

Revenue by day of week line chart with Friday as the low point at 53

Nếu không chỉ định loại biểu đồ, ChatGPT sẽ tự xác định loại biểu đồ phù hợp nhất để xuất ra.

ChatGPT data analysis chart comparing total revenue for weekdays versus weekends

Ở góc trên bên phải của biểu đồ, bạn có thể tải xuống hoặc mở rộng kích thước biểu đồ. Theo mặc định, biểu đồ được tải xuống sẽ ở định dạng PNG.

Bạn cũng có thể chỉnh sửa màu sắc biểu đồ hoặc bật/tắt tính tương tác của biểu đồ. Khi thay đổi màu, bạn có thể chọn một trong các màu mặc định của chúng tôi hoặc nhập mã hex của một màu.

Color settings panel with Dataset color set to blue and Interactive toggled on

Các loại phân tích phổ biến

ChatGPT được huấn luyện để thực hiện nhiều tác vụ phân tích dữ liệu khác nhau. Một số tác vụ phổ biến gồm:

Phát hiện và xử lý bất thường

Khi đưa ra quyết định dựa trên dữ liệu, điều quan trọng là phải đảm bảo dữ liệu nguồn của bạn chính xác nhất có thể. ChatGPT biết cách xác định dữ liệu có thể bị thiếu hoặc không chính xác. Những vấn đề phổ biến mà ChatGPT có thể phát hiện và sửa chữa bao gồm:

  • Giá trị bị thiếu

  • Giá trị ngoại lai

  • Hàng trùng lặp

  • Kiểu dữ liệu không chính xác

Hãy bắt đầu phân tích bằng một câu lệnh như sau: Kiểm tra dữ liệu này để tìm các vấn đề phổ biến.

Sau khi ChatGPT xác định được các vấn đề phổ biến, bạn có thể yêu cầu nó khắc phục các vấn đề đó. Tùy thuộc vào các vấn đề gặp phải, ChatGPT có thể đưa ra nhiều lựa chọn để bạn chọn. Nếu bạn chưa chắc về ý nghĩa của các lựa chọn này, hãy thử yêu cầu ChatGPT cung cấp thêm thông tin.

Tổng hợp & tích hợp

ChatGPT có thể tổng hợp lượng lớn dữ liệu có cấu trúc để giúp bạn hiểu rõ thông tin. Một số phép tổng hợp mà ChatGPT có thể thực hiện gồm:

  • Tổng

  • Trung bình (trung vị, trung bình cộng, mốt)

  • Giá trị nhỏ nhất và lớn nhất

  • Số lượng giá trị khác biệt

  • Độ lệch chuẩn

Bạn có thể mở rộng một bảng và chọn một hoặc nhiều cột số, sau đó dùng một câu lệnh như sau: Tính trung vị và độ lệch chuẩn cho dữ liệu này.

ChatGPT cũng có thể hợp nhất nhiều tập dữ liệu với nhau dựa trên các mã định danh dùng chung.

Giả sử bạn tải lên hai bảng tính, một bảng chứa khách hàng và một bảng chứa giao dịch mua. Bản ghi giao dịch mua được liên kết với bản ghi khách hàng thông qua thuộc tính customer_id . ChatGPT biết cách tích hợp cả hai tệp thành một tập dữ liệu duy nhất để có thể trả lời các câu hỏi như “Tổng tất cả giao dịch mua của khách hàng có gói vàng là bao nhiêu?

ChatGPT sẽ tự động hợp nhất các tập dữ liệu cho bạn khi bạn đặt một câu hỏi cần đến việc đó.

Phân tích thống kê nâng cao

ChatGPT hiểu cách thực hiện nhiều dạng phân tích thống kê khác nhau và có thể chọn các kỹ thuật phù hợp dựa trên yêu cầu của bạn. Một số loại phân tích mà ChatGPT có thể thực hiện gồm:

  • Thống kê so sánh: Phương pháp này liên quan đến việc so sánh các nhóm hoặc biến khác nhau để hiểu điểm khác biệt hoặc tương đồng giữa chúng. Các kỹ thuật bao gồm kiểm định t, ANOVA (phân tích phương sai) và MANOVA (phân tích phương sai đa biến).

  • Phân tích tương quan và hồi quy: Các phương pháp này đánh giá mối quan hệ giữa các biến. Phân tích tương quan đo lường độ mạnh và hướng của mối quan hệ, trong khi phân tích hồi quy mô hình hóa mối quan hệ để dự đoán kết quả.

  • Phân tích chuỗi thời gian: Loại phân tích này xem xét các điểm dữ liệu được thu thập theo thời gian để xác định xu hướng, chu kỳ và ảnh hưởng theo mùa. Các phương pháp bao gồm ARIMA (Autoregressive Integrated Moving Average) và phân rã theo mùa.

Bạn không cần phải là nhà khoa học dữ liệu để sử dụng các kỹ thuật này! Nếu bạn không chắc kỹ thuật nào phù hợp nhất với dữ liệu của mình, hãy thử cho ChatGPT biết điều bạn muốn hiểu và yêu cầu nó đề xuất kỹ thuật phân tích tốt nhất. Nếu bạn không chắc cách diễn giải kết quả phân tích, hãy yêu cầu ChatGPT giải thích cho bạn. Một câu lệnh hiệu quả có thể là: Có điều gì đáng chú ý hoặc bất thường về phân tích này không?

Bài viết này có hữu ích không?