| 注意 :由于近期法律变动,部分服务的数据保留可能受到影响,详情请参阅我们的 博客文章 。 |
|---|
OpenAI 的基础模型,包括为 ChatGPT 提供支持的模型,是通过三种主要信息来源开发的:(1)互联网上公开可用的信息,(2)我们与第三方合作获取的信息,以及(3)我们的用户、人类训练师和研究人员提供或生成的信息。
本文概述了我们在开发这些模型时使用的公开可用信息,并说明我们如何在遵守隐私法律的前提下收集和使用这些信息。要了解我们如何收集和使用使用我们服务的用户信息,包括如何选择不允许将您的 ChatGPT 对话用于帮助训练我们的模型,请参阅我们的隐私政策和这篇帮助中心文章。
什么是 ChatGPT?它是如何运作的?
ChatGPT 是一种基于人工智能的服务,您可以通过互联网访问。您可以使用 ChatGPT 执行多种任务,包括组织和总结信息、协助翻译、分析或生成图片、激发创意和灵感,以及其他日常活动。ChatGPT 旨在通过从大量信息中学习模式,包括文本、图片、音频和视频,来理解和响应用户的问题和指令。在训练过程中,模型会分析数据中的各种关系,例如单词在上下文中通常如何同时出现,并利用这种理解在生成回复时逐字预测下一个最可能的词。同样,生成其他形式内容(如图片)的模型会学习像素之间的关系,以及它们与训练数据中相关标题的关系模式。
例如,在模型的学习过程(称为“训练”)中,模型可能会被赋予完成一个句子的任务,例如:“她没有向左转,而是转向了___。”在训练初期,其反应大多是随机的。然而,随着模型处理和学习大量文本,它在识别模式和预测最可能的下一个词方面的能力不断提高。这一过程在数百万个句子中反复进行,以提升其理解能力并提高准确性。
因为有多种合理的方法来完成一个句子,例如“她没有向左转,而是向右转”、“转了一圈”或“返回”,因此模型的响应中存在固有的随机性。因此,相同的问题在不同的查询中可能会产生不同的答案。
机器学习模型由大量数字以及用于解释和使用这些数字的代码组成,这些数字被称为“权重”或“参数”。这些模型不会存储或保留它们所训练数据的副本。相反,随着模型的学习,其参数值会稍作调整,以反映其识别出的模式。在前面的例子中,模型从预测随机词语到做出更准确的预测,不是通过存储训练句子,而是通过更新其内部参数。模型在训练过程中不会保留其处理的句子、图片或音频的副本。ChatGPT 并不会从其训练数据中“复制粘贴” — 这就像一位老师在经过长期钻研后,能够通过理解概念之间的关系来解释概念,而不是逐字背诵或复述原始教材。在生成用户请求的响应时,模型利用这些学习到的权重来预测并创建新内容。
用于训练 ChatGPT 的公开信息都包括哪些类型?
对于公开可用的互联网内容,我们仅使用在互联网上可以自由和公开访问的信息。我们不会有意从已知位于付费墙之后的来源或暗网收集数据。此外,我们应用筛选来移除我们不希望模型学习的内容,例如仇恨言论、成人内容、聚合个人信息的网站和垃圾信息。剩余的信息随后用于训练我们的模型。
个人信息是否用于训练 ChatGPT?
在线内容中有相当一部分涉及个人信息,因此我们的训练数据可能会偶然包含这些信息。然而,我们不会故意收集个人信息来训练我们的模型。
我们使用训练数据来提升模型的能力,例如预测、推理和解决问题的能力,而不是用于建立用户画像、联系个人,或开展广告或营销活动。
在某些情况下,模型可能会从个人信息中学习,以理解姓名和地址等元素在语言中的功能,或识别公众人物和知名实体。这有助于模型生成更准确且符合语境的回复。
我们采取积极措施,在训练期间限制处理个人信息。例如,我们排除那些汇集大量个人数据的来源,并训练我们的模型以避免响应涉及个人隐私或敏感信息的请求。
ChatGPT 的开发如何符合隐私法律的要求?
我们合法地使用训练信息。我们的基础模型支持广泛的有益应用——从内容创作和客户支持到软件开发、个性化教育和科学研究。这些功能依赖于大规模训练数据。用于训练我们模型的信息是公开可用的,并无意对个人造成伤害。我们基于隐私法(例如 GDPR)中的“合法权益”条款来收集和使用包含在训练信息中的个人信息,详细信息请参阅我们的隐私政策。我们已完成数据保护影响评估,帮助确保我们以合法且负责任的方式收集和使用这些信息。
我们会回应反对处理等相关权利请求。。由于语言学习的缘故,ChatGPT 的回复有时可能会包含在公共互联网上多次出现的个人信息(例如,公众人物)。在某些司法管辖区,个人可以通过我们的隐私门户反对我们的模型处理其个人信息,或提出其他数据主体权利请求。您也可以通过联系 dsar@openai.com 来行使这些权利。
请注意,根据隐私法,某些权利可能并非绝对。如果我们有正当的法律依据,我们可能会拒绝该请求。然而,我们努力优先保护个人信息,并遵守所有适用的隐私法律。如果您觉得我们没有充分解决问题,您有权向您所在地区的监督机构提出投诉。
如需详细了解 OpenAI 在您使用我们的网站、应用和服务时如何收集和处理与您相关的个人信息,请参阅我们的《隐私政策》。
