我們相信,負責任、反覆迭代的開發與部署,是實現安全通用人工智能的途徑。在向公眾推出任何模型之前,我們都會進行大量安全與一致性測試及緩解工作;同時,我們亦設有自動化和人工系統,協助偵測在我們為個人提供的服務(例如 ChatGPT 和 GPTs)上出現的有問題內容。我們在下文概述其中一些工作。
ChatGPT 與 ImageGen
我們使用自動化工具,例如我們的 /moderations API 內部版本,以偵測可能有害或違反我們使用政策的內容(提示詞、完成內容、上載內容)。如果我們偵測到有問題的內容,通常會警告你你的內容可能違反我們的使用政策,或阻止模型回應你的提示詞。我們亦可能防止包含有問題提示詞或完成內容的對話被分享。在極少數情況下,我們亦可能因嚴重不當行為而禁止你的帳戶。
我們亦接受人們舉報 ChatGPT 上有問題的內容。我們會結合自動化系統和受訓專家團隊來審查這些舉報。
ChatGPT:如果有人分享了你認為包含有問題內容的對話,你亦可以向我們舉報。
如欲進一步了解如何直接在 ChatGPT 中舉報內容,請參閱這篇文章。
GPTs
我們亦使用自動化工具,例如我們的 /moderation API,以判斷某個 GPT 是否可能有問題。如果我們偵測到與該 GPT 相關的有問題內容,我們會採取行動,例如防止其被分發。建立者可以編輯 GPT 或 API 的配置,以移除有問題的內容,亦可透過產品內流程就決定提出申訴。在極少數情況下,我們亦可能因嚴重不當行為而禁止建立者的帳戶。
我們亦接受人們舉報有問題的 GPT。如果你看到某個 GPT 你認為違反我們的使用政策,或以其他方式反映有問題的內容,你亦可以向我們舉報。我們會結合自動化系統和受訓專家團隊來審查這些舉報。
