Tương tác với bảng trong ChatGPT
Khi bạn tải tệp lên, ChatGPT sẽ tự động tạo chế độ xem bảng tương tác cho phép bạn cuộn qua dữ liệu và xem tất cả các hàng và cột.
Sau khi tệp được tải lên, bạn có thể đặt thêm các câu hỏi liên quan đến tập dữ liệu. Các câu lệnh không cần nêu rõ thao tác cụ thể — những lệnh ngôn ngữ tự nhiên như “phân tích” hoặc “so sánh” là đủ để ChatGPT tạo ra kết quả.
Bạn cũng có thể tạo bảng trực tiếp trong ChatGPT bằng cách yêu cầu đầu ra được tạo dưới dạng bảng.
Để xem dữ liệu rõ hơn, bạn có thể mở rộng bảng bằng cách nhấp vào hai mũi tên ở góc trên bên phải của bảng:
Trong chế độ xem bảng, bạn có thể chọn một hàng hoặc cột cụ thể và tạo câu lệnh để lấy insight về phần dữ liệu được tô sáng. Ví dụ: ở đây chúng tôi đã chọn một cột và hỏi mục xuất hiện thường xuyên nhất.
Bạn có thể chọn nhiều hàng hoặc cột bằng cách nhấn giữ phím Command trên Mac hoặc phím Ctrl trên Windows rồi nhấp vào các hàng hoặc cột. Bạn cũng có thể chọn nhiều ô bằng cách nhấp vào một ô rồi kéo chuột để bao phủ vùng mong muốn.
Sau khi chọn nhiều mục, bạn có thể yêu cầu ChatGPT tính toán một giá trị hoặc thực hiện một hành động trên các giá trị đã chọn. Ví dụ: bạn có thể tô sáng một nhóm ô và yêu cầu ChatGPT tính giá trị trung bình.
Chỉnh sửa và tạo bảng với ChatGPT
Bạn có thể tải lên và chỉnh sửa các bảng hiện có bằng cách yêu cầu ChatGPT thực hiện cập nhật. Ví dụ: bạn có thể yêu cầu ChatGPT cập nhật một bảng bằng cách thêm một cột chứa các giá trị trung bình.
Bạn có thể yêu cầu ChatGPT thực hiện các thay đổi cụ thể bằng cách tô sáng các cột, hàng hoặc ô mà bạn muốn dùng làm cơ sở cập nhật. Ở đây, chúng tôi đã tô sáng hai cột và yêu cầu thêm một cột mới vào bảng chứa tổng của chúng.
Bạn có thể tải xuống bảng do ChatGPT tạo ra bằng cách nhấp vào nút tải xuống ở góc trên bên phải của bảng. Xin lưu ý rằng tệp được tải xuống sẽ ở định dạng CSV.
Trực quan hóa dữ liệu của bạn với ChatGPT
Sau khi tải tệp lên, bạn có thể yêu cầu ChatGPT tạo biểu đồ tĩnh. Bạn có thể để ChatGPT xác định loại biểu đồ phù hợp nhất cho tập dữ liệu hoặc chỉ định một trong các loại biểu đồ được hỗ trợ trong câu lệnh: biểu đồ đường, biểu đồ cột, biểu đồ tròn, biểu đồ tần suất, biểu đồ phân tán, biểu đồ hộp (Box-and-Whisker Plots), bản đồ nhiệt, biểu đồ miền, biểu đồ radar, treemap, biểu đồ bong bóng và biểu đồ thác nước.
Xin lưu ý rằng hiện tại trong đa số trường hợp chỉ có biểu đồ cột, tròn, phân tán và đường là có tính tương tác.
Nếu không chỉ định loại biểu đồ, ChatGPT sẽ tự xác định loại biểu đồ phù hợp nhất để xuất ra.
Ở góc trên bên phải của biểu đồ, bạn có thể tải xuống hoặc mở rộng kích thước biểu đồ. Theo mặc định, biểu đồ được tải xuống sẽ ở định dạng PNG.
Bạn cũng có thể chỉnh sửa màu sắc biểu đồ hoặc bật/tắt tính tương tác của biểu đồ. Khi thay đổi màu, bạn có thể chọn một trong các màu mặc định của chúng tôi hoặc nhập mã hex của một màu.
Các loại phân tích phổ biến
ChatGPT được huấn luyện để thực hiện nhiều tác vụ phân tích dữ liệu khác nhau. Một số tác vụ phổ biến gồm:
Phát hiện và xử lý bất thường
Khi đưa ra quyết định dựa trên dữ liệu, điều quan trọng là phải đảm bảo dữ liệu nguồn của bạn chính xác nhất có thể. ChatGPT biết cách xác định dữ liệu có thể bị thiếu hoặc không chính xác. Những vấn đề phổ biến mà ChatGPT có thể phát hiện và sửa chữa bao gồm:
Giá trị bị thiếu
Giá trị ngoại lai
Hàng trùng lặp
Kiểu dữ liệu không chính xác
Hãy bắt đầu phân tích bằng một câu lệnh như sau: Kiểm tra dữ liệu này để tìm các vấn đề phổ biến.
Sau khi ChatGPT xác định được các vấn đề phổ biến, bạn có thể yêu cầu nó khắc phục các vấn đề đó. Tùy thuộc vào các vấn đề gặp phải, ChatGPT có thể đưa ra nhiều lựa chọn để bạn chọn. Nếu bạn chưa chắc về ý nghĩa của các lựa chọn này, hãy thử yêu cầu ChatGPT cung cấp thêm thông tin.
Tổng hợp & tích hợp
ChatGPT có thể tổng hợp lượng lớn dữ liệu có cấu trúc để giúp bạn hiểu rõ thông tin. Một số phép tổng hợp mà ChatGPT có thể thực hiện gồm:
Tổng
Trung bình (trung vị, trung bình cộng, mốt)
Giá trị nhỏ nhất và lớn nhất
Số lượng giá trị khác biệt
Độ lệch chuẩn
Bạn có thể mở rộng một bảng và chọn một hoặc nhiều cột số, sau đó dùng một câu lệnh như sau: Tính trung vị và độ lệch chuẩn cho dữ liệu này.
ChatGPT cũng có thể hợp nhất nhiều tập dữ liệu với nhau dựa trên các mã định danh dùng chung.
Giả sử bạn tải lên hai bảng tính, một bảng chứa khách hàng và một bảng chứa giao dịch mua. Bản ghi giao dịch mua được liên kết với bản ghi khách hàng thông qua thuộc tính customer_id . ChatGPT biết cách tích hợp cả hai tệp thành một tập dữ liệu duy nhất để có thể trả lời các câu hỏi như “Tổng tất cả giao dịch mua của khách hàng có gói vàng là bao nhiêu?”
ChatGPT sẽ tự động hợp nhất các tập dữ liệu cho bạn khi bạn đặt một câu hỏi cần đến việc đó.
Phân tích thống kê nâng cao
ChatGPT hiểu cách thực hiện nhiều dạng phân tích thống kê khác nhau và có thể chọn các kỹ thuật phù hợp dựa trên yêu cầu của bạn. Một số loại phân tích mà ChatGPT có thể thực hiện gồm:
Thống kê so sánh: Phương pháp này liên quan đến việc so sánh các nhóm hoặc biến khác nhau để hiểu điểm khác biệt hoặc tương đồng giữa chúng. Các kỹ thuật bao gồm kiểm định t, ANOVA (phân tích phương sai) và MANOVA (phân tích phương sai đa biến).
Phân tích tương quan và hồi quy: Các phương pháp này đánh giá mối quan hệ giữa các biến. Phân tích tương quan đo lường độ mạnh và hướng của mối quan hệ, trong khi phân tích hồi quy mô hình hóa mối quan hệ để dự đoán kết quả.
Phân tích chuỗi thời gian: Loại phân tích này xem xét các điểm dữ liệu được thu thập theo thời gian để xác định xu hướng, chu kỳ và ảnh hưởng theo mùa. Các phương pháp bao gồm ARIMA (Autoregressive Integrated Moving Average) và phân rã theo mùa.
Bạn không cần phải là nhà khoa học dữ liệu để sử dụng các kỹ thuật này! Nếu bạn không chắc kỹ thuật nào phù hợp nhất với dữ liệu của mình, hãy thử cho ChatGPT biết điều bạn muốn hiểu và yêu cầu nó đề xuất kỹ thuật phân tích tốt nhất. Nếu bạn không chắc cách diễn giải kết quả phân tích, hãy yêu cầu ChatGPT giải thích cho bạn. Một câu lệnh hiệu quả có thể là: Có điều gì đáng chú ý hoặc bất thường về phân tích này không?
