我們相信，負責任、反覆迭代的開發與部署，是實現安全通用人工智能的途徑。在向公眾推出任何模型之前，我們都會進行大量安全與一致性測試及緩解工作；同時，我們亦設有自動化和人工系統，協助偵測在我們為個人提供的服務（例如 ChatGPT 和 GPTs）上出現的有問題內容。我們在下文概述其中一些工作。

ChatGPT 與 ImageGen

我們使用自動化工具，例如我們的 /moderations API 內部版本，以偵測可能有害或違反我們使用政策的內容（提示詞、完成內容、上載內容）。如果我們偵測到有問題的內容，通常會警告你你的內容可能違反我們的使用政策，或阻止模型回應你的提示詞。我們亦可能防止包含有問題提示詞或完成內容的對話被分享。在極少數情況下，我們亦可能因嚴重不當行為而禁止你的帳戶。

我們亦接受人們舉報 ChatGPT 上有問題的內容。我們會結合自動化系統和受訓專家團隊來審查這些舉報。

ChatGPT：如果有人分享了你認為包含有問題內容的對話，你亦可以向我們舉報。

如欲進一步了解如何直接在 ChatGPT 中舉報內容，請參閱這篇文章。

GPTs

我們亦使用自動化工具，例如我們的 /moderation API，以判斷某個 GPT 是否可能有問題。如果我們偵測到與該 GPT 相關的有問題內容，我們會採取行動，例如防止其被分發。建立者可以編輯 GPT 或 API 的配置，以移除有問題的內容，亦可透過產品內流程就決定提出申訴。在極少數情況下，我們亦可能因嚴重不當行為而禁止建立者的帳戶。

我們亦接受人們舉報有問題的 GPT。如果你看到某個 GPT 你認為違反我們的使用政策，或以其他方式反映有問題的內容，你亦可以向我們舉報。我們會結合自動化系統和受訓專家團隊來審查這些舉報。

我們如何識別面向個人服務中的問題內容

ChatGPT 與 ImageGen

GPTs

這篇文章對你有幫助嗎？