OpenAI

我們如何在供個人使用的服務中辨識有問題的內容

更新日期:yesterday

我們相信,負責任且迭代式的開發與部署,是實現安全通用人工智慧的一種途徑。在向大眾推出模型之前,我們會進行大量安全性與對齊測試緩和措施,同時也已建立自動化與人工系統,協助偵測出現在我們面向個人的服務(例如 ChatGPT 和 GPTs)上的問題內容。以下概述其中幾項相關工作。

ChatGPT 與 ImageGen

我們會使用自動化工具,例如我們的 /moderations API 內部版本,來偵測可能有害或違反我們《使用政策》的內容(提示詞、完成內容、上傳內容)。如果我們偵測到有問題的內容,通常會警告您該內容可能違反我們《使用政策》,或阻止模型回應您的提示詞。我們也可能會阻止包含問題提示詞或完成內容的對話被分享。在極少數情況下,我們也可能會因您的嚴重不當行為而停權您的帳號。我們也接受人工檢舉的「ChatGPT」上有問題的內容。我們結合使用自動化系統與訓練有素的專家團隊來審查這些報告。

  • ChatGPT:如果有人分享你認為含有不當內容的對話,你也可以向我們檢舉

若要進一步了解如何直接在 ChatGPT 中檢舉內容,請參閱這篇文章

GPT

我們也會使用自動化工具,例如我們的 /moderation API,以判斷某個 GPT 是否可能有問題。如果我們偵測到與該 GPT 相關的有問題內容,我們會採取行動,例如防止該 GPT 被發布。建立者可以編輯 GPT 或 API 的設定,以移除有問題的內容,或透過產品內流程對該決定提出申訴。在極少數情況下,若建置者有嚴重違規行為,我們也可能會停權該建置者的帳號。我們也接受針對有問題的 GPT 所提出的人工檢舉。如果你看到某個 GPT,認為其違反我們的使用政策,或以其他方式呈現有問題的內容,你也可以向我們檢舉。我們結合使用自動化系統與訓練有素的專家團隊來審查這些報告。

這篇文章有幫助嗎?