OpenAI
页面内容为机器翻译。查看英文原文

PDF 视觉检索常见问题

更新于:7 minutes ago

这是什么功能?

ChatGPT Enterprise 现在支持读取和理解提示中所含 PDF 文件内嵌的视觉内容(图片、图表、示意图等)。用户可以上传 PDF,ChatGPT 能够解读该文件中的文本以及任何视觉元素。

它如何运作?

  1. 点击聊天中的回形针(附件)图标即可上传 PDF。

  2. ChatGPT 会读取 PDF 中的文本以及任何嵌入的图片或图示。

  3. 然后,你可以提问或请求总结——从提取报告要点到解释复杂图表都可以。

它是否兼容 GPT 和项目?

部分兼容。作为 GPT 知识项目文件上传的 PDF 会使用纯文本检索进行处理。用户在与已发布的 GPT互动期间或在项目对话中上传的 PDF 会使用视觉检索进行处理。

谁可以使用它?

此功能仅面向 ChatGPT Enterprise 客户开放。ChatGPT 免费版、Pro、Team 或 Edu 账户支持此功能。

它解决了什么问题?

以前,ChatGPT 只能处理单独上传的图片(例如 PNG/JPEG)。PDF 中嵌入的视觉内容会被忽略。现在,ChatGPT 可以一次性结合文本和视觉内容进行更全面的分析,从而给出更准确、更具上下文的回答。

此功能最终会扩展到其他方案吗?

它目前仅面向 Enterprise 开放,未来可能会扩展。我们正在关注客户反馈,以确定何时以及如何扩大支持范围。

这篇文章对你有帮助吗?