Câu hỏi thường gặp về truy xuất hình ảnh trong PDF

Đây là tính năng gì?

ChatGPT Enterprise hiện hỗ trợ đọc và hiểu nội dung trực quan (hình ảnh, biểu đồ, sơ đồ, v.v.) được nhúng trong các tệp PDF có trong câu lệnh. Người dùng có thể tải lên một tệp PDF và ChatGPT có thể diễn giải văn bản cũng như mọi yếu tố trực quan trong tệp đó.

Tính năng này hoạt động như thế nào?

Nhấp vào biểu tượng kẹp giấy (tệp đính kèm) trong cuộc trò chuyện để tải PDF của bạn lên.
ChatGPT sẽ đọc cả văn bản lẫn mọi hình ảnh hoặc sơ đồ được nhúng trong PDF.
Sau đó, bạn có thể đặt câu hỏi hoặc yêu cầu tóm tắt—từ việc trích xuất các ý chính của một báo cáo đến giải thích các biểu đồ phức tạp.

Tính năng này có tương thích với GPT và Dự án không?

Một phần. Các PDF được tải lên dưới dạng Kiến thức GPT hoặc Tệp dự án được xử lý bằng truy xuất chỉ văn bản. Các PDF do người dùng tải lên trong khi tương tác với một GPT đã phát hành hoặc trong một cuộc trò chuyện Dự án được xử lý bằng truy xuất trực quan.

Ai có thể sử dụng tính năng này?

Khả năng này chỉ dành cho khách hàng ChatGPT Enterprise. Tính năng này không được hỗ trợ cho tài khoản ChatGPT Free, Pro, Team hoặc Edu.

Tính năng này giải quyết vấn đề gì?

Trước đây, ChatGPT chỉ có thể xử lý hình ảnh khi được tải lên riêng lẻ (ví dụ: dưới dạng PNG/JPEG). Các nội dung trực quan được nhúng trong PDF đã bị bỏ qua. Giờ đây, ChatGPT có thể cung cấp phân tích toàn diện hơn—kết hợp văn bản và nội dung trực quan cùng lúc—giúp phản hồi chính xác hơn và giàu ngữ cảnh hơn.

Tính năng này cuối cùng có được mở rộng sang các gói khác không?

Hiện tính năng này chỉ dành riêng cho Enterprise và có thể được mở rộng trong tương lai. Chúng tôi đang theo dõi phản hồi của khách hàng để xác định thời điểm và cách mở rộng hỗ trợ.