我們相信，負責任且迭代式的開發與部署，是實現安全通用人工智慧的一種途徑。在向大眾推出模型之前，我們會進行大量安全性與對齊測試和緩和措施，同時也已建立自動化與人工系統，協助偵測出現在我們面向個人的服務（例如 ChatGPT 和 GPTs）上的問題內容。以下概述其中幾項相關工作。

ChatGPT 與 ImageGen

我們會使用自動化工具，例如我們的 /moderations API 內部版本，來偵測可能有害或違反我們《使用政策》的內容（提示詞、完成內容、上傳內容）。如果我們偵測到有問題的內容，通常會警告您該內容可能違反我們《使用政策》，或阻止模型回應您的提示詞。我們也可能會阻止包含問題提示詞或完成內容的對話被分享。在極少數情況下，我們也可能會因您的嚴重不當行為而停權您的帳號。我們也接受人工檢舉的「ChatGPT」上有問題的內容。我們結合使用自動化系統與訓練有素的專家團隊來審查這些報告。

ChatGPT：如果有人分享你認為含有不當內容的對話，你也可以向我們檢舉。

若要進一步了解如何直接在 ChatGPT 中檢舉內容，請參閱這篇文章。

GPT

我們也會使用自動化工具，例如我們的 /moderation API，以判斷某個 GPT 是否可能有問題。如果我們偵測到與該 GPT 相關的有問題內容，我們會採取行動，例如防止該 GPT 被發布。建立者可以編輯 GPT 或 API 的設定，以移除有問題的內容，或透過產品內流程對該決定提出申訴。在極少數情況下，若建置者有嚴重違規行為，我們也可能會停權該建置者的帳號。我們也接受針對有問題的 GPT 所提出的人工檢舉。如果你看到某個 GPT，認為其違反我們的使用政策，或以其他方式呈現有問題的內容，你也可以向我們檢舉。我們結合使用自動化系統與訓練有素的專家團隊來審查這些報告。

我們如何在供個人使用的服務中辨識有問題的內容

ChatGPT 與 ImageGen

GPT

這篇文章有幫助嗎？