依據加州民法第 3111 條的訓練資料摘要

OpenAI 在加州提供公開可用的生成式 AI 系統。我們使用各種資料來源來開發這些系統，包括公開可得的資料、我們與第三方合作取得的資料，以及我們的使用者、真人訓練師和研究人員提供或生成的資訊。我們也使用合成資料來開發系統。

我們運用資料，幫助系統更瞭解人類語言與世界。這進而讓我們的系統得以提升人類創造力、促進科學探索與醫學研究，並讓數億人改善日常生活。我們的系統使用包含數兆個 Token 的文字、圖像、音訊及視聽內容資料集進行開發。

我們使用多元資料來開發系統，其中包括可能受著作權保護的資料以及屬於公有領域的資料。雖然我們會採取措施減少訓練資料集中的個人資訊量，但部分資料仍可能包含如《加州民法典》第 1798.140 條所定義的個人資訊及彙總消費者資訊。使用者可以透過我們的隱私權入口網站，選擇退出其內容用於訓練，並要求從 ChatGPT 回應中移除特定個人資訊。我們使用各種技術來處理資料集，以提升模型的效能和準確度。

我們大約自 2018 年起開始蒐集資料，用於開發系統，並持續蒐集資料至今。我們於 2021 年首次將資料集用於系統開發。

關於我們系統開發的更多資訊，請參閱我們的系統說明卡。

依據加州民法第 3111 條的訓練資料摘要

這篇文章有幫助嗎？