概述
离线网页搜索是适用于符合条件的 ChatGPT 工作空间的一种网页搜索配置。它允许 ChatGPT 使用 OpenAI 已索引和缓存的网页内容,而不是在每次请求时使用实时网页搜索。
离线网页搜索面向具有更严格治理、合规或数据处理要求的组织。根据工作空间配置,它可以在限制使用实时外部搜索提供商的同时,帮助支持需要网页搜索的工作流。
可用性
离线网页搜索适用于符合条件的 ChatGPT 工作空间,包括某些企业、教育、医疗保健、教师、受监管和联邦工作空间配置。
可用性取决于您的方案、合同、工作空间配置和管理员设置。某些受监管工作空间配置可能默认启用离线网页搜索。其他符合条件的工作空间可能需要 OpenAI 为工作空间配置它,或可将其作为锁定模式的一部分使用。
离线网页搜索适用于 ChatGPT 的网页搜索行为。它不描述 API 平台行为。
工作原理
启用离线网页搜索后,ChatGPT 会使用 OpenAI 已索引和缓存的网页内容进行网页搜索。这意味着 ChatGPT 可以返回 OpenAI 索引或缓存中已有页面的信息。
覆盖范围和新鲜度可能因网站、页面、语言、地区和内容类型而异。
如果某个页面或 URL 不在索引或缓存中,ChatGPT 将无法通过离线网页搜索检索它。在这些情况下,用户可能需要直接提供来源材料,或在其工作空间允许的情况下使用实时网页搜索。
判断离线网页搜索是否适合您的工作流
离线网页搜索更适合稳定的网页研究,而不适合需要实时新鲜度、有保证的 URL 可用性或审计级证据的工作流。
使用此表判断离线网页搜索是否适合某个工作流。
| 工作流需求 | 使用离线网页搜索时的预期情况 | 推荐路径 |
|---|---|---|
| 来自公共网页的一般研究 | 当相关内容可用时,ChatGPT 可以使用 OpenAI 已索引和缓存的网页内容。 | 在不需要精确实时新鲜度时使用离线网页搜索。 |
| 使用一个特定 URL 作为来源 | 只有当该页面在索引或缓存中可用时,ChatGPT 才能使用该 URL。如果页面不可用,ChatGPT 可能无法检索它,或表示无法访问该页面。 | 上传来源材料、粘贴相关文本、提供另一个 URL,或在工作空间允许的情况下使用实时网页搜索。 |
| 确认页面在特定时间的内容 | 离线网页搜索结果可能不包含页面被索引或缓存的确切时间。 | 使用官方来源、已上传文件、归档记录,或其他已批准的权威来源流程。 |
| 研究最新信息 | 结果可能比实时网页版本更旧。新鲜度因页面和网站而异。 | 如果允许,请使用实时网页搜索,或直接提供当前来源材料。 |
| 搜索长尾或小众网站 | 某些页面可能缺失、过期或仅部分呈现。 | 用其他来源交叉核对、上传材料,或在允许的情况下使用实时网页搜索。 |
| 分析动态、个性化或需登录的内容 | 依赖脚本、个性化、账户或频繁更新的内容可能不完整或不可用。 | 使用稳定文档、PDF、导出内容、已批准的连接器或已上传文件。 |
| 详细查看页面 | 离线网页搜索可能会检索缓存或索引内容,但更深层导航可能仅限于已索引或已缓存的页面。 | 提出有针对性的后续问题、提供相关页面内容,或在允许的情况下使用实时网页搜索。 |
设置要求
离线网页搜索可根据您的工作空间以不同方式配置。
对于某些符合条件的工作空间,管理员可以通过将成员分配到已启用锁定模式的自定义角色,使离线网页搜索可用。如果通过锁定模式角色启用离线网页搜索,其他锁定模式限制也可能适用。
对于其他符合条件的工作空间,离线网页搜索可能由 OpenAI 作为工作空间级配置应用。某些受监管工作空间配置可能默认使用离线网页搜索。
在推出离线网页搜索之前,管理员应确认:
离线网页搜索是否适用于该工作空间。
该配置是应用于整个工作空间、按角色应用,还是两者皆有。
预期设置是否需要锁定模式。
哪些相关工作空间功能或角色权限可能会变化。
哪些用户组应使用离线网页搜索。
如果您在工作空间中没有看到相关设置,请联系您的 OpenAI 客户团队或 OpenAI 支持,以确认离线网页搜索是否可用以及如何配置。
启用离线网页搜索
符合条件的工作空间管理员或许可以通过以下方式之一启用离线网页搜索:
将成员分配到已启用锁定模式的自定义角色。
让 OpenAI 为工作空间配置网页搜索限制。
使用默认启用缓存或索引网页访问的受监管工作空间配置。
可用的设置路径取决于您的工作空间配置和合同。请联系您的 OpenAI 客户代表了解更多信息。
搜索覆盖范围和新鲜度
离线网页搜索不保证覆盖整个公共网络。页面可能缺失、不可用、不完整,或比实时版本更旧。
OpenAI 的系统可能会快速更新某些已索引内容,但不为特定 URL 提供刷新 SLA。某个页面可能会根据网站、抓取访问权限、缓存、受欢迎程度和其他技术因素,以不同的计划刷新。
内容缺失或过期的常见原因包括:
网站通过 robots.txt 或类似控制阻止抓取。
网站使用 CDN 或机器人拦截机制。
页面需要登录或个性化设置。
内容高度依赖脚本或动态加载。
页面较新、访问很少或信号较弱。
网站结构使较深层页面更难被发现。
特定 URL 行为
如果用户要求 ChatGPT 使用特定 URL,只有当该页面在索引或缓存中可用时,离线网页搜索才能使用该 URL。
如果该 URL 不可用,ChatGPT 可能无法检索它,或表示无法访问该页面。不应将离线网页搜索视为可抓取每个公共 URL 的保证。
如果某个特定 URL 很重要,请使用以下替代方案之一:
提供另一个 URL。
直接上传来源材料。
将相关文本粘贴到 ChatGPT 中。
如果您的工作空间允许,请使用实时网页搜索。
来源时间戳
离线网页搜索结果可能不包含页面被索引或缓存的确切时间。
如果您的工作流需要有保证的引用时间戳、某一页面在特定时刻的审计级证据,或证明某个来源在响应时是最新的,请不要使用离线网页搜索。对于这些工作流,请使用客户提供的材料、官方文档,或其他已批准的权威来源流程。
安全性
离线网页搜索旨在支持更严格的网络访问控制。它将网页搜索限制为 OpenAI 已索引和缓存的网页内容,而不是在请求时使用实时外部网页搜索。
这旨在帮助组织降低网页搜索查询在请求时被发送到实时外部搜索提供商的可能性,具体取决于工作空间配置。
离线网页搜索并不能消除所有风险。已索引或缓存的网页内容仍可能包含不准确信息、不完整信息、过时信息或恶意指令。用户应查看引用的来源,并遵循其组织的数据处理政策。
与锁定模式及其他功能的关系
离线网页搜索仅说明 ChatGPT 如何执行网页搜索。
某些工作空间将离线网页搜索用作更广泛安全配置的一部分,例如锁定模式或受监管的工作空间设置。在这些配置中,其他功能也可能受到限制或被停用。这些限制来自更广泛的安全配置,而非仅由离线网页搜索造成。
如果通过锁定模式角色启用离线网页搜索,其他锁定模式限制也可能适用。
如果在没有更广泛安全模式的情况下启用离线网页搜索,大多数 ChatGPT 功能不应仅因搜索使用 OpenAI 已索引和缓存的网页内容而发生变化。但是,任何仅依赖实时外部网页搜索的功能,在离线网页搜索中可能无法以相同方式工作。
功能可用性取决于您的工作空间设置、角色权限和方案。
常见问题
如何确认离线网页搜索已启用?
可能没有单独面向用户、标为“离线网页搜索”的指示器。
启用离线网页搜索后,用户可能会注意到 ChatGPT 仍可搜索网页,但结果来自 OpenAI 已索引和缓存的网页内容,而不是在请求时来自实时外部搜索提供商。
用户还可能注意到:
某些特定 URL 无法检索。
某些结果比实时网页版本更旧。
当页面不可用时,ChatGPT 可能会要求上传或粘贴来源材料。
如果您需要确认工作空间的确切配置,请联系您的 OpenAI 客户团队或 OpenAI 支持。
离线网页搜索是否覆盖所有公共网站?
否。离线网页搜索覆盖范围广泛,但不保证覆盖。由于抓取限制、网站配置、动态内容或索引限制,某些页面可能不可用。
离线网页搜索是否支持所有语言和地区?
离线网页搜索不限于单一语言或地区,但覆盖范围和新鲜度可能因网站、地区、语言和页面而异。
离线网页搜索是实时的吗?
否。离线网页搜索使用已索引和缓存的内容。某些内容可能较新,但特定页面可能比实时网页版本更旧。
ChatGPT 能否显示页面缓存时间?
并不总是。如果您的工作流需要可靠的时间戳,请使用已上传的来源材料、官方文档,或其他已批准的权威来源流程。
离线网页搜索是否会取代实时网页搜索?
对于符合条件的工作空间,在不需要实时新鲜度、有保证的 URL 可用性或审计级证据的工作流中,可以使用离线网页搜索代替实时网页搜索。它不能完全替代实时网页搜索。
离线网页搜索是否会影响应用或连接器?
离线网页搜索不会自动决定应用或连接器的可用性。应用、连接器和相关操作由您的工作空间设置、角色权限和安全配置控制。
如果离线网页搜索作为锁定模式或受监管工作空间配置的一部分启用,某些应用或实时功能也可能受到限制。
