OpenAI

ChatGPT 和我們基礎模型的具體開發方式

深入了解我們如何開發模型並將其應用於 ChatGPT 等產品的相關資訊

更新日期:3 days ago
注意
:由於近期法律條文變動,部分服務的資料保存方式可能受到影響,詳情請參閱我們的部落格文章

OpenAI 的基礎模型 (包括支援 ChatGPT 的模型),是使用三個主要資訊來源開發:(1) 網路上公開可得的資訊,(2) 我們與第三方合作取得的資訊,以及 (3) 我們的使用者、真人訓練師和研究員提供或產生的資訊。

本文將概述我們用於協助開發模型的公開資訊,以及我們如何在遵守隱私權法規的前提下收集和使用這些資訊。若要了解我們如何收集和使用服務使用者的資訊,包括如何選擇不提供 ChatGPT 對話來協助我們教導模型,請參閱我們的隱私權政策本說明中心文章

何謂 ChatGPT,它是如何運作的?

ChatGPT 是一項可以透過網路存取、以人工智慧為基礎的服務。你可以使用 ChatGPT 來完成多種任務,包括組織及總結資訊、協助翻譯、分析或生成圖像、激發創意和靈感,以及其他日常活動。ChatGPT 是透過學習大量資訊中的模式來理解並回應使用者的問題和指令,這些資訊包括文字、圖像、音訊和影片。在訓練過程中,模型會分析資料中的關係,例如單詞在上下文中通常如何一起出現,並利用這種理解來預測產生回應時下一個最有可能的單詞,一次預測一個單詞。同樣地,產生其他形式內容的模型 (例如圖像),會學習訓練資料中像素之間的關係,以及這些像素與相關標題之間的關聯。

例如,在模型的學習過程(稱為「訓練」)中,模型可能會被指派任務,要完成一個句子,例如:「而不是向左轉,她向___轉。」在訓練初期,模型的回應大多是隨機的。然而,隨著模型處理大量文字並從中學習,它會變得更擅長識別模式及預測最有可能出現的下一個單詞。這個過程會在數百萬個句子中反覆進行,以提升其理解能力並提高準確性。

因為有多種合理的方法來完成一個句子,例如「她沒有向左轉,而是向右轉」、「轉身調頭」或「向後轉」,因此模型的反應中存在固有的隨機性。因此,相同的問題在不同的查詢中可能會得到不同的答案。

機器學習模型由大量數字組成 (這些數字稱為「權重」或「參數」) 以及解釋和使用這些數字的程式碼。這些模型不會儲存或保留它們訓練的資料副本。反之,隨著模型的學習,其參數值會稍作調整,以反映其識別出的模式。在較早的範例中,模型從預測隨機字詞提升為做出更準確的預測,這不是透過儲存訓練句子來實現的,而是透過更新其內部參數。模型在訓練過程中不會保留其處理的句子、圖像或音訊的副本。ChatGPT 並不會從其訓練資料中「複製貼上」—這類似於老師在經過廣泛學習後,能夠透過理解概念之間的關係來解釋概念,而無需記憶或逐字逐句地複述原始材料。當產生使用者要求的回應時,模型會利用這些學到的權重來預測並建立新的內容。

使用什麼類型的公共資訊來教導 ChatGPT?

對於公開可得的網路內容,我們僅使用在網際網路上免費且公開取得的資訊。我們不會故意從已知需要付費才能存取的來源或暗網收集資料。此外,我們會套用篩選條件來移除不希望模型學習的內容,例如仇恨言論、成人內容、彙總個人資訊的網站和垃圾訊息。剩餘的資訊將用來訓練我們的模型。

是否會用個人資訊來教導 ChatGPT?

線上內容中有相當大的一部分涉及個人資訊,因此我們的訓練資料也免不了會包含個人資訊。然而,我們不會故意收集個人資訊來訓練模型。

我們使用訓練資料來發展模型的能力,例如預測、推理和解決問題,而不是用來建立使用者檔案、聯絡個人,或作為我們廣告或行銷活動的一部分。

在某些情況下,模型可能會從個人資訊中學習,藉此了解姓名和地址等元素在語言中的作用,或識別公眾人物和知名實體。這有助於模型產生更準確且符合上下文的回應。

我們採取積極措施,限制在訓練過程中處理個人資訊。例如,我們排除彙總大量個人資料的來源,並訓練模型避免回應涉及個人隱私或敏感資訊的要求。

ChatGPT 在開發期間如何遵守隱私權保護法?

我們以合法方式使用訓練資訊。我們的基礎模型為各種有益的應用提供了支援—從內容創作和客戶支援到軟體開發、個人化教育和科學研究。這些功能仰賴於大規模的訓練資料。用於訓練我們模型的資訊是公開可得的,並無意圖對個人造成傷害。我們是基於隱私權保護法 (如 GDPR) 所規定的合法權益來收集和使用載於訓練資訊中的個人資訊,詳情請參閱我們的隱私權政策。我們完成了資料保護影響評估,以協助確保我們合法、負責任地收集和使用個人資訊。

我們會對異議要求和類似權利做出回應由於學習語言的結果,ChatGPT 的回應有時可能包含某些人士已在公共網際網路上出現多次的個人資訊 (例如公眾人物)。某些司法管轄區的個人可以透過我們的隱私權入口網站反對我們的模型處理其個人資訊或提出其他資料主體權利相關之請求。您也可以透過傳送電子郵件至 dsar@openai.com 行使這些權利。

請注意,根據隱私法,有些權利可能不是絕對的。如有合法理由,我們可以拒絕要求。然而,我們致力於優先保護個人資訊,並遵守所有適用的隱私法規。如果你認為我們沒有充分解決問題,則有權向當地監管機構提出申訴。

請參閱我們的隱私權政策進一步了解 OpenAI 在你使用我們的網站、應用程式和服務時向你收集個人資訊或收集與你相關之個人資訊的做法

這篇文章有幫助嗎?