OpenAI
页面内容为机器翻译。查看英文原文

PDF 视觉检索常见问题

更新于:13 days ago

这个功能是什么?

ChatGPT Enterprise 现已支持读取并理解提示词中所包含的 PDF 文件内嵌的视觉内容(图片、图表、示意图等)。用户可以上传一个 PDF,ChatGPT 能解读其中的文字以及任何视觉元素。

它是如何工作的?

  1. 在聊天中点击回形针(附件)图标上传你的 PDF。

  2. ChatGPT 会同时读取 PDF 中的文字以及内嵌的图片或图示。

  3. 随后你可以提问或请求摘要——从提取报告要点到解释复杂图表都可以。

它与 GPT 和 Projects 兼容吗?

部分兼容。作为 GPT 知识Project 文件 上传的 PDF 将使用仅文本检索进行处理。用户在与已发布的 GPT 交互期间上传的 PDF,或在Project 对话中上传的 PDF,则会使用视觉检索进行处理。

谁可以使用?

此功能仅对 ChatGPT Enterprise 客户开放。ChatGPT Free、Pro、Team 或 Edu 账户支持。

它解决了什么问题?

此前,ChatGPT 只能在图片被单独上传时处理图像(例如 PNG/JPEG)。PDF 内嵌的视觉内容会被忽略。现在,ChatGPT 可以一次性结合文字与视觉信息进行更完整的分析,从而给出更准确、上下文更丰富的回答。

这个功能未来会扩展到其他套餐吗?

目前该功能仅限 Enterprise,未来可能会扩展。我们正在收集客户反馈,以决定何时以及如何扩大支持范围。

这篇文章对你有帮助吗?