页面内容为机器翻译。查看英文原文。

PDF 视觉检索常见问题

更新于：13 days ago

这个功能是什么？

ChatGPT Enterprise 现已支持读取并理解提示词中所包含的 PDF 文件内嵌的视觉内容（图片、图表、示意图等）。用户可以上传一个 PDF，ChatGPT 能解读其中的文字以及任何视觉元素。

它是如何工作的？

在聊天中点击回形针（附件）图标上传你的 PDF。
ChatGPT 会同时读取 PDF 中的文字以及内嵌的图片或图示。
随后你可以提问或请求摘要——从提取报告要点到解释复杂图表都可以。

它与 GPT 和 Projects 兼容吗？

部分兼容。作为 GPT 知识或 Project 文件上传的 PDF 将使用仅文本检索进行处理。用户在与已发布的 GPT 交互期间上传的 PDF，或在Project 对话中上传的 PDF，则会使用视觉检索进行处理。

谁可以使用？

此功能仅对 ChatGPT Enterprise 客户开放。ChatGPT Free、Pro、Team 或 Edu 账户不支持。

它解决了什么问题？

此前，ChatGPT 只能在图片被单独上传时处理图像（例如 PNG/JPEG）。PDF 内嵌的视觉内容会被忽略。现在，ChatGPT 可以一次性结合文字与视觉信息进行更完整的分析，从而给出更准确、上下文更丰富的回答。

这个功能未来会扩展到其他套餐吗？

目前该功能仅限 Enterprise，未来可能会扩展。我们正在收集客户反馈，以决定何时以及如何扩大支持范围。

这篇文章对你有帮助吗？