OpenAI

我们如何识别我们面向个人的服务中的问题内容

更新于:14 days ago

我们相信,以负责任、迭代式的方式进行开发与部署,是实现安全通用人工智能的途径。我们在向公众发布模型之前,会进行大量安全与对齐方面的测试缓解工作;同时,我们也建立了自动化与人工系统,帮助检测在我们面向个人的服务(如 ChatGPT 和 GPTs)中出现的问题内容。下面我们概述其中的一些举措。

ChatGPT、ImageGen 和 SORA

我们使用自动化工具(例如我们内部版本的 /moderations API)来检测可能有害或违反我们《使用政策》的内容(提示词、输出内容、上传内容)。如果我们检测到问题内容,通常会提醒你你的内容可能违反我们的使用政策,或阻止模型响应你的提示。我们也可能会阻止包含问题提示或输出内容的对话被分享。在极少数情况下,对于性质恶劣的行为,我们也可能会封禁你的账号。

我们也接受关于 ChatGPT 和 SORA 中问题内容的人工举报。我们会结合自动化系统与受过培训的专家团队来审核这些举报。

  • ChatGPT:如果有人分享了一段你认为包含问题内容的对话,你也可以向我们举报

  • SORA:如果你在信息流中看到你认为包含问题内容的视频或图片,你可以向我们举报

如需了解如何在 ChatGPT 或 SORA 中直接举报内容的更多详情,请参阅这篇文章

GPTs

我们也会使用自动化工具(例如我们的 /moderation API)来判断某个 GPT 是否可能存在问题。如果我们检测到与该 GPT 相关的问题内容,我们会采取措施,例如阻止其被分发。创建者可以编辑 GPT 或 API 的配置以移除问题内容,或通过产品内流程对该决定提出申诉。在极少数情况下,对于性质恶劣的行为,我们也可能会封禁创建者的账号。

我们也接受关于问题 GPT 的人工举报。如果你看到某个 GPT 你认为违反了我们的使用政策,或以其他方式体现出问题内容,你也可以向我们举报。我们会结合自动化系统与受过培训的专家团队来审核这些举报。

这篇文章对你有帮助吗?