OpenAI

依據加州民法第 3111 條的訓練資料摘要

更新日期:13 days ago

OpenAI 在加州提供公開可用的生成式 AI 系統。我們使用各種資料來源來開發這些系統,包括公開可得的資料、我們與第三方合作取得的資料,以及我們的使用者、真人訓練師和研究人員提供或生成的資訊。我們也使用合成資料來開發系統。我們運用資料,幫助系統更瞭解人類語言與世界。這進而讓我們的系統得以提升人類創造力、促進科學探索與醫學研究,並讓數億人改善日常生活。我們的系統使用包含數兆個 Token 的文字、圖像、音訊及視聽內容資料集進行開發。我們使用多元資料來開發系統,其中包括可能受著作權保護的資料以及屬於公有領域的資料。雖然我們會採取措施減少訓練資料集中的個人資訊量,但部分資料仍可能包含如《加州民法典》第 1798.140 條所定義的個人資訊及彙總消費者資訊。使用者可以透過我們的隱私權入口網站,選擇退出其內容用於訓練,並要求從 ChatGPT 回應中移除特定個人資訊。我們使用各種技術來處理資料集,以提升模型的效能和準確度。我們大約自 2018 年起開始蒐集資料,用於開發系統,並持續蒐集資料至今。我們於 2021 年首次將資料集用於系統開發。關於我們系統開發的更多資訊,請參閱我們的系統說明卡。

這篇文章有幫助嗎?