我们相信,以负责任、迭代式的方式进行开发与部署,是实现安全通用人工智能的途径。我们在向公众发布模型之前,会进行大量安全与对齐方面的测试与缓解工作;同时,我们也建立了自动化与人工系统,帮助检测在我们面向个人的服务(如 ChatGPT 和 GPTs)中出现的问题内容。下面我们概述其中的一些举措。
ChatGPT、ImageGen 和 SORA
我们使用自动化工具(例如我们内部版本的 /moderations API)来检测可能有害或违反我们《使用政策》的内容(提示词、输出内容、上传内容)。如果我们检测到问题内容,通常会提醒你你的内容可能违反我们的使用政策,或阻止模型响应你的提示。我们也可能会阻止包含问题提示或输出内容的对话被分享。在极少数情况下,对于性质恶劣的行为,我们也可能会封禁你的账号。
我们也接受关于 ChatGPT 和 SORA 中问题内容的人工举报。我们会结合自动化系统与受过培训的专家团队来审核这些举报。
如需了解如何在 ChatGPT 或 SORA 中直接举报内容的更多详情,请参阅这篇文章。
GPTs
我们也会使用自动化工具(例如我们的 /moderation API)来判断某个 GPT 是否可能存在问题。如果我们检测到与该 GPT 相关的问题内容,我们会采取措施,例如阻止其被分发。创建者可以编辑 GPT 或 API 的配置以移除问题内容,或通过产品内流程对该决定提出申诉。在极少数情况下,对于性质恶劣的行为,我们也可能会封禁创建者的账号。
我们也接受关于问题 GPT 的人工举报。如果你看到某个 GPT 你认为违反了我们的使用政策,或以其他方式体现出问题内容,你也可以向我们举报。我们会结合自动化系统与受过培训的专家团队来审核这些举报。
