我們相信,以負責任、循序漸進的方式進行開發和部署,是實現安全通用人工智能的途徑。我們在向公眾推出模型之前,會先進行大量與安全及對齊相關的測試和緩解措施,並且亦設有自動化及人工系統,協助偵測在我們面向個人的服務(例如 ChatGPT 和 GPTs)上出現的問題內容。以下概述其中一些工作。
ChatGPT、ImageGen 和 SORA
我們使用自動化工具,例如我們/moderations API的內部版本,來偵測可能有害或違反《使用政策》的內容(提示詞、完成內容、上載內容)。如果我們偵測到問題內容,通常會警告你相關內容可能違反我們的使用政策,或阻止模型回應你的提示詞。我們亦可能阻止含有問題提示詞或完成內容的對話被分享。在極少數情況下,對於惡劣行為,我們亦可能封禁你的帳戶。
我們亦接受有關 ChatGPT 和 SORA 上問題內容的人工舉報。我們會結合自動化系統與受過訓練的專家團隊來審核這些舉報。
如需了解如何直接在 ChatGPT 或 SORA 中舉報內容的更多詳情,請參閱這篇文章。
GPTs
我們亦使用自動化工具,例如我們的/moderation API,以查看某個 GPT 是否可能有問題。如果我們偵測到與該 GPT 相關的問題內容,我們會採取行動,例如阻止其被分發。建立者可以編輯 GPT 或 API 的設定,以移除問題內容,或透過產品內流程提出申訴。在極少數情況下,對於惡劣行為,我們亦可能封禁建立者的帳戶。
我們亦接受有關問題 GPTs 的人工舉報。如果你看到某個你認為違反我們使用政策或以其他方式反映問題內容的 GPT,你亦可以向我們舉報。我們會結合自動化系統與受過訓練的專家團隊來審核這些舉報。
