根據《加州民法典》第 3111 條的訓練數據摘要

OpenAI 在加利福尼亞州提供公開可用的生成式 AI 系統。我們使用多種資料來源開發這些系統，包括公開可用的資料、我們與第三方合作存取的資料，以及由我們的用戶或人類訓練員和研究人員提供或生成的資訊。我們亦使用合成資料開發我們的系統。

我們使用資料協助我們的系統更好地理解人類語言和世界。這進而讓我們的系統能夠提升人類創造力、推動科學發現和醫學研究，並讓數以億計的人改善日常生活。我們的系統是在包含數以萬億計 token 的文字、圖像、音訊和視聽內容資料集上開發。

我們使用多元化的資料來開發我們的系統，包括可能受版權保護的資料，以及屬於公有領域的資料。儘管我們採取措施減少訓練資料集中的個人資訊量，但我們的部分資料可能包含加州《民法典》第 1798.140 條所定義的個人資訊和彙總消費者資訊。我們的用戶可以使用我們的私隱入口網站，選擇不讓其內容用於訓練，亦可要求從 ChatGPT 回應中移除某些個人資訊。我們使用多種技術處理資料集，以改善模型的效能和準確度。

我們約於 2018 年開始收集資料以開發我們的系統，並且至今仍持續收集資料。我們於 2021 年首次將資料集用於系統開發。

有關我們系統開發的其他資訊，可參閱我們的系統說明卡。

根據《加州民法典》第 3111 條的訓練數據摘要

這篇文章對你有幫助嗎？