OpenAI
Trang này được dịch bằng máy học. Xem bài viết gốc bằng tiếng Anh.

Câu hỏi thường gặp về truy xuất hình ảnh trong PDF

Đã cập nhật: 16 days ago

Tính năng này là gì?

ChatGPT Enterprise hiện hỗ trợ đọc và hiểu các yếu tố trực quan (hình ảnh, biểu đồ, sơ đồ, v.v.) được nhúng trong các tệp PDF đính kèm trong câu lệnh. Người dùng có thể tải lên một tệp PDF, và ChatGPT có thể diễn giải văn bản mọi yếu tố trực quan trong tệp đó.

Nó hoạt động như thế nào?

  1. Nhấp vào biểu tượng kẹp giấy (tệp đính kèm) trong cuộc trò chuyện để tải PDF của bạn lên.

  2. ChatGPT sẽ đọc cả văn bản lẫn mọi hình ảnh hoặc sơ đồ được nhúng trong PDF.

  3. Sau đó, bạn có thể đặt câu hỏi hoặc yêu cầu tóm tắt—từ việc trích xuất các ý chính của một báo cáo đến giải thích các biểu đồ phức tạp.

Nó có tương thích với GPT và Dự án không?

Một phần. PDF được tải lên dưới dạng GPT Knowledge hoặc Tệp dự án sẽ được xử lý bằng truy xuất chỉ văn bản. PDF do người dùng tải lên trong khi tương tác với một GPT đã xuất bản hoặc trong một cuộc trò chuyện của Dự án sẽ được xử lý bằng truy xuất hình ảnh.

Ai có thể sử dụng?

Khả năng này chỉ dành cho khách hàng ChatGPT Enterprise. Tính năng này không được hỗ trợ cho các tài khoản ChatGPT Free, Pro, Team hoặc Edu.

Nó giải quyết vấn đề gì?

Trước đây, ChatGPT chỉ có thể xử lý hình ảnh khi chúng được tải lên riêng lẻ (ví dụ: dưới dạng PNG/JPEG). Các yếu tố trực quan được nhúng trong PDF sẽ bị bỏ qua. Giờ đây, ChatGPT có thể cung cấp phân tích toàn diện hơn—kết hợp văn bản và hình ảnh trong một lần xử lý—giúp đưa ra các câu trả lời chính xác hơn và giàu ngữ cảnh hơn.

Tính năng này cuối cùng có mở rộng sang các gói khác không?

Hiện tại, tính năng này chỉ dành riêng cho Enterprise và có thể sẽ được mở rộng trong tương lai. Chúng tôi đang theo dõi phản hồi của khách hàng để xác định thời điểm và cách thức mở rộng hỗ trợ.

Bài viết này có hữu ích không?