जानें कि हम अपने मॉडल कैसे विकसित करते हैं और उन्हें ChatGPT जैसे उत्पादों में कैसे लागू करते हैं

OpenAI के फाउंडेशन मॉडल, जिनमें वे मॉडल शामिल हैं जो ChatGPT को संचालित करते हैं, तीन मुख्य स्रोतों से जानकारी प्राप्त करके विकसित किए जाते हैं:: (1) इंटरनेट पर सार्वजनिक रूप से उपलब्ध जानकारी, (2) वह जानकारी जिसे हम थर्ड पार्टी के साथ साझेदारी करके प्राप्त करते हैं, और (3) वह जानकारी जो हमारे यूज़र, मानव प्रशिक्षक, और शोधकर्ता प्रदान करते हैं या जनरेट करते हैं।

ChatGPT में इस्तेमाल होने वाले फ़ाउंडेशन मॉडल विकसित करने में कई चरण शामिल होते हैं, जिनमें ट्रेनिंग डेटा तैयार करना, प्री-ट्रेनिंग और पोस्ट-ट्रेनिंग, साथ ही डिप्लॉयमेंट के बाद निरंतर मूल्यांकन और सुधार शामिल हैं. इन चरणों में विभिन्न उद्देश्यों के लिए अलग-अलग प्रकार की जानकारी का उपयोग किया जा सकता है, जिनमें मॉडल के प्रदर्शन, विश्वसनीयता और सुरक्षा में सुधार करना शामिल है.

यह लेख उन जानकारियों का अवलोकन प्रदान करता है, जिनका उपयोग हम इन मॉडल को विकसित करने में मदद के लिए करते हैं, हम प्राइवेसी कानूनों का पालन करते हुए उन जानकारियों को कैसे एकत्र और उपयोग करते हैं, और पूरी ट्रेनिंग प्रक्रिया के दौरान हम कौन-से सुरक्षा उपाय लागू करते हैं. हमारी सेवाओं के यूज़र्स से हम जानकारी कैसे एकत्र करते हैं और उसका उपयोग कैसे करते हैं, जिसमें यह भी शामिल है कि हमारे मॉडल को बेहतर बनाने में सहायता के लिए ChatGPT वार्तालापों का उपयोग किए जाने से आप कैसे ऑप्ट आउट कर सकते हैं, यह समझने के लिए कृपया हमारी प्राइवेसी पॉलिसी और यह सहायता केंद्र लेख देखें.

ChatGPT क्या है और यह कैसे काम करता है?

ChatGPT एक आर्टिफ़िशियल इंटेलिजेंस-आधारित सेवा है, जिसे आप इंटरनेट या ऐप के माध्यम से एक्सेस कर सकते हैं. आप ChatGPT का उपयोग कई प्रकार के कार्यों के लिए कर सकते हैं, जैसे जानकारी को व्यवस्थित करना और उसका सारांश बनाना, अनुवाद में सहायता करना, कोडिंग, शोध और विश्लेषण में सहायता करना, टूल्स में कई चरणों वाले कार्यों को पूरा करना, इमेज का विश्लेषण करना या उन्हें उत्पन्न करना, रचनात्मकता और विचारों के लिए प्रेरणा देना, और अन्य दैनिक गतिविधियाँ. ChatGPT को टेक्स्ट, इमेज, ऑडियो और वीडियो सहित बड़ी मात्रा में जानकारी से पैटर्न सीखकर आपके सवालों और निर्देशों को समझने और उनका जवाब देने के लिए डिज़ाइन किया गया है.

ट्रेनिंग के दौरान, मॉडल इस डेटा के भीतर मौजूद संबंधों का विश्लेषण करता है—जैसे कि संदर्भ में शब्द आम तौर पर एक साथ कैसे दिखाई देते हैं—और जवाब उत्पन्न करते समय अगले सबसे संभावित शब्द की भविष्यवाणी करने के लिए उस समझ का उपयोग करता है, एक बार में एक शब्द. टेक्स्ट को छोटी इकाइयों में बदला जा सकता है, जिन्हें कभी-कभी “टोकन” कहा जाता है, जो पूरे शब्दों, शब्दों के हिस्सों या विराम चिह्नों को दर्शा सकते हैं. टोकन टेक्स्ट के वे मूल घटक होते हैं जिन्हें मॉडल प्रसंस्कृत करता है. इसी तरह, छवियों जैसे अन्य प्रकार का कंटेंट उत्पन्न करने वाले मॉडल, प्रशिक्षण डेटा में पिक्सल्स एक-दूसरे से और उनसे जुड़े कैप्शन्स से कैसे संबंधित होते हैं, इसके पैटर्न सीखते हैं.

उदाहरण के लिए, मॉडल के सीखने की प्रक्रिया (जिसे “ट्रेनिंग” कहा जाता है) के दौरान, मॉडल को इस तरह के वाक्य को पूरा करने का टास्क दिया जा सकता है: “बाएँ मुड़ने के बजाय, वह ___ मुड़ गई।” ट्रेनिंग के शुरूआती चरण में, इसके जवाब काफी हद तक रैंडम होते हैं। हालांकि, जब मॉडल बड़ी मात्रा में टेक्स्ट को प्रोसेस करता है और उससे सीखता है, तो यह पैटर्न को पहचानने और अगले संभावित शब्द की भविष्यवाणी करने में बेहतर हो जाता है। यह प्रक्रिया लाखों वाक्यों पर दोहराई जाती है ताकि इसकी समझ को परिष्कृत किया जा सके और सटीकता बढ़ाई जा सके।

क्योंकि एक वाक्य को पूरा करने के कई सही तरीके हो सकते हैं — जैसे “बाएँ मुड़ने की बजाय, वह दाएँ मुड़ी,” “चारों ओर मुड़ी,” या “वापस मुड़ी” — इसलिए मॉडल के उत्तरों में स्वाभाविक रूप से कुछ मात्रा में यादृच्छिकता होती है। इसी कारण, एक ही प्रश्न के अलग-अलग बार पूछे जाने पर अलग-अलग उत्तर मिल सकते हैं।

मशीन लर्निंग मॉडल बहुत बड़े संख्यात्मक सेटों से बने होते हैं, जिन्हें “वेट्स” या “पैरामीटर्स” कहा जाता है, और उस कोड से जो इन संख्याओं का उपयोग और व्याख्या करता है। ये मॉडल उस डेटा की प्रतियां संग्रहीत या नहीं रखते हैं, जिन पर वे प्रशिक्षित होते हैं। इसके बजाय, जैसे-जैसे एक मॉडल सीखता है, उसके पैरामीटर्स के मानों को थोड़ा समायोजित किया जाता है ताकि वह पहचाने गए पैटर्न को दर्शा सके। पहले के उदाहरण में, मॉडल ने अनियमित शब्दों की भविष्यवाणी से सटीक भविष्यवाणी करने में सुधार किया—उसने यह ट्रेनिंग वाक्यों को स्टोर करके नहीं, बल्कि अपने आंतरिक पैरामीटर्स को अपडेट करके किया। मॉडल ट्रेनिंग के दौरान जिन वाक्यों, इमेजों या ऑडियो को प्रोसेस करता है, उनकी प्रतिलिपियाँ नहीं रखता। ChatGPT अपनी ट्रेनिंग डेटा से 'कॉपी और पेस्ट' नहीं करता —जैसे एक शिक्षक, जो गहन अध्ययन के बाद, विचारों के बीच संबंधों को समझकर अवधारणाओं को समझा सकता है, बिना मूल सामग्री को शब्दशः याद किए या पुनः प्रस्तुत किए। जब यूज़र के अनुरोध का जवाब जनरेट किया जाता है, तो मॉडल इन सीखे हुए वेट्स का उपयोग करके नए कंटेंट की भविष्यवाणी और निर्माण करता है।

ChatGPT को सिखाने के लिए किस प्रकार की जानकारी का उपयोग किया जाता है?

सार्वजनिक रूप से उपलब्ध इंटरनेट कंटेंट के मामले में, हम केवल ऐसी जानकारी का इस्तेमाल करते हैं जो इंटरनेट पर स्वतंत्र रूप से और खुले तौर पर एक्सेस की जा सकती है. इसमें सार्वजनिक रूप से उपलब्ध वेबपेज, सार्वजनिक फ़ोरम, सार्वजनिक ब्लॉग, सार्वजनिक पोस्ट और अन्य सार्वजनिक रूप से उपलब्ध ऑनलाइन कंटेंट शामिल हो सकती है. उदाहरण के लिए, यदि आप किसी सार्वजनिक रूप से उपलब्ध ऑनलाइन चर्चा फ़ोरम में भाग लेते हैं या कोई सार्वजनिक ब्लॉग या अन्य पोस्ट प्रकाशित करते हैं, तो हम उस सार्वजनिक रूप से सुलभ कंटेंट का उपयोग मॉडल ट्रेनिंग के उद्देश्यों के लिए कर सकते हैं. हालांकि, हम अपनी प्रशिक्षण प्रक्रिया में व्यक्तिगत जानकारी के प्रसंस्करण को कम करने के लिए कदम उठाते हैं. सार्वजनिक रूप से उपलब्ध इंटरनेट कंटेंट इकट्ठा करते समय, हम जानबूझकर ऐसे स्रोतों से डेटा इकट्ठा नहीं करते हैं जो पेवॉल के पीछे हैं या डार्क वेब से हैं. इसके अतिरिक्त, हम ऐसे कंटेंट हटाने के लिए फ़िल्टर लागू करते हैं, जिससे हम नहीं चाहते कि हमारे मॉडल सीखें, जैसे कि नफ़रत भरी स्पीच, एडल्ट कंटेंट, व्यक्तिगत जानकारी इकट्ठा करने वाली साइटें, और स्पैम. फिर बची हुई जानकारी का इस्तेमाल हमारे मॉडल को ट्रेन करने के लिए किया जाता है.

वेबसाइट मालिक यह नियंत्रित कर सकते हैं कि उनकी साइट के सार्वजनिक कंटेंट को प्रशिक्षण के लिए एक्सेस किया जा सकता है या नहीं. इसके लिए वे robots.txt जैसे मानक वेब नियंत्रणों का उपयोग करके GPTBot को अनुमति न दे सकते हैं, जो हमारे मॉडल को प्रशिक्षित करने में मदद के लिए सार्वजनिक कंटेंट को क्रॉल कर सकता है. हम वेबसाइट मालिकों को यह प्रबंधित करने में मदद करने के लिए मार्गदर्शन प्रदान करते हैं कि उनकी साइटें और कंटेंट हमारे AI सिस्टम के साथ कैसे इंटरैक्ट करती हैं.

हम अपने मॉडल को ट्रेन करने और बेहतर बनाने में मदद के लिए तृतीय-पक्ष पार्टनर से मिली जानकारी का भी उपयोग करते हैं. इसमें उन डेटासेट में मौजूद जानकारी शामिल हो सकती है जिन्हें हम तृतीय पक्षों के साथ किए गए समझौतों के माध्यम से एक्सेस करते हैं, साथ ही मानव प्रशिक्षकों और शोधकर्ताओं द्वारा प्रदान या जनरेट की गई जानकारी भी शामिल हो सकती है, जहाँ हमारी नीतियों और समझौतों के तहत अनुमति हो. इससे हमारे मॉडल की गुणवत्ता, सुरक्षा और प्रदर्शन को बेहतर बनाने में मदद मिलती है. इन स्रोतों में डेटासेट के आधार पर टेक्स्ट, इमेज, ऑडियो, वीडियो या अन्य डेटा प्रकार शामिल हो सकते हैं.

हम कुछ प्रशिक्षण प्रक्रियाओं में सिंथेटिक डेटा का उपयोग बढ़ा रहे हैं. उदाहरण के लिए, हम सिंथेटिक प्रॉम्प्ट्स, बहुभाषी उदाहरण या अन्य ट्रेनिंग कंटेंट जनरेट करने के लिए जानकारी और अपने मॉडल का उपयोग कर सकते हैं. सिंथेटिक डेटा मॉडल के प्रदर्शन को बेहतर बनाने में मदद कर सकता है, जिसमें उन क्षेत्रों में ट्रेनिंग डेटा को पूरक बनाना शामिल है जहाँ डेटा कम या असंतुलित है, और यह मॉडल डेवलपमेंट के लिए प्राइवेसी बढ़ाने वाले तरीकों का भी समर्थन कर सकता है.

क्या ChatGPT को सिखाने के लिए व्यक्तिगत जानकारी का उपयोग किया जाता है?

ऑनलाइन कंटेंट का एक महत्वपूर्ण हिस्सा लोगों के बारे में जानकारी से संबंधित होता है, इसलिए हमारे ट्रेनिंग डेटा में अनजाने में व्यक्तिगत जानकारी शामिल हो सकती है. हालांकि, हम अपनी प्रशिक्षण प्रक्रिया में व्यक्तिगत जानकारी के प्रसंस्करण को कम करने के लिए कदम उठाते हैं.

हम ट्रेनिंग डेटा का उपयोग मॉडल की क्षमताओं—जैसे पूर्वानुमान, रीज़निंग और समस्या-समाधान—को विकसित करने के लिए करते हैं, न कि व्यक्तियों की प्रोफ़ाइल बनाने, उनसे संपर्क करने या उनके लिए विज्ञापन व्यक्तिगत बनाने के लिए.

कुछ मामलों में, मॉडल व्यक्तिगत जानकारी से यह सीख सकते हैं कि नाम और पते जैसी चीज़ें भाषा में कैसे काम करती हैं, या सार्वजनिक व्यक्तियों और प्रसिद्ध संस्थाओं को पहचानने में मदद मिलती है। यह मॉडल को अधिक सटीक और संदर्भानुकूल उत्तर देने में सहायता करता है।

प्रशिक्षण के दौरान व्यक्तिगत जानकारी की सुरक्षा कैसे की जाती है?

हम प्रशिक्षण के दौरान व्यक्तिगत जानकारी की प्रक्रिया को सीमित करने के लिए सक्रिय कदम उठाते हैं. उदाहरण के लिए, हम उन ज्ञात स्रोतों को शामिल नहीं करते जो बड़ी मात्रा में व्यक्तिगत डेटा एकत्रित करते हैं, प्रशिक्षण प्रक्रिया में व्यक्तिगत जानकारी को कम करने के लिए फ़िल्टरिंग लागू करते हैं, और प्रशिक्षण डेटा को दोहराने के जोखिम को कम करने के लिए डुप्लिकेट कंटेंट की पहचान कर उसे हटाने के कदम उठाते हैं. इसके अलावा, हम अपने मॉडल को व्यक्तियों के बारे में निजी या संवेदनशील जानकारी के अनुरोधों का जवाब देने से बचने के लिए प्रशिक्षित करते हैं.

हम जानकारी कितने समय तक रखते हैं

हम प्रशिक्षण डेटा में जानकारी केवल उतनी अवधि तक रखते हैं, जितनी इस लेख और हमारी प्राइवेसी पॉलिसी में वर्णित उद्देश्यों के लिए उचित रूप से आवश्यक हो, जिसमें हमारे मॉडल विकसित करना और सुधारना तथा संबंधित वैज्ञानिक अनुसंधान उद्देश्य शामिल हैं. प्रतिधारण, उसकी निरंतर आवश्यकता सुनिश्चित करने के लिए समय-समय पर समीक्षा के अधीन होता है, और यह जानकारी के प्रकार तथा उसका उपयोग कैसे किया जाता है, इसके आधार पर अलग-अलग होता है. जानकारी को रखने की अवधि निर्धारित करते समय, हम ऐसे कारकों पर विचार करते हैं, जैसे जानकारी को प्रोसेस करने का हमारा उद्देश्य, जानकारी की मात्रा, प्रकृति और संवेदनशीलता, अनधिकृत उपयोग या प्रकटीकरण से नुकसान का संभावित जोखिम और ऐसे कोई कानूनी दायित्व जिनके हम अधीन हैं.

ChatGPT का विकास गोपनीयता कानूनों का पालन कैसे करता है?

हम प्रशिक्षण जानकारी का उपयोग कानूनी रूप से करते हैं. हमारे आधार मॉडल कई तरह के लाभकारी अनुप्रयोगों को शक्ति प्रदान करते हैं—जिसमें एक्सेसिबिलिटी टूल्स, कस्टमर सपोर्ट, सॉफ़्टवेयर डेवलपमेंट, पर्सनलाइज़्ड एजुकेशन और वैज्ञानिक अनुसंधान शामिल हैं. ये क्षमताएँ लार्ज-स्केल ट्रेनिंग डेटा पर निर्भर करती हैं, जिसमें सार्वजनिक रूप से उपलब्ध जानकारी और तृतीय-पक्ष साझेदारों से प्राप्त जानकारी शामिल है. हम प्रशिक्षण प्रक्रिया के दौरान सुरक्षा उपाय लागू करते हैं, जिनमें प्रशिक्षण प्रक्रिया में व्यक्तिगत जानकारी के प्रसंस्करण को कम करने और जोखिमों को घटाने के लिए डिज़ाइन किए गए कदम शामिल हैं, जैसा कि इस लेख में बताया गया है. हम प्रशिक्षण जानकारी में शामिल व्यक्तिगत जानकारी के अपने संग्रह और उपयोग को GDPR जैसे प्राइवेसी कानूनों के तहत वैध हितों पर आधारित करते हैं, जिसमें हमारे मिशन के अनुरूप—यह सुनिश्चित करना कि आर्टिफ़िशियल जेनरल इंटेलिजेंस से सभी को लाभ हो—यूज़र्स और व्यापक समाज के लिए अपने मॉडल को ट्रेन करना और बेहतर बनाना शामिल है, जैसा कि हमारी प्राइवेसी पॉलिसी में अधिक विस्तार से समझाया गया है. हमने यह सुनिश्चित करने में मदद के लिए डेटा संरक्षण प्रभाव आकलन पूरा कर लिया है कि हम इस जानकारी को कानूनी रूप से और जिम्मेदारी के साथ एकत्र और उपयोग कर रहे हैं.

जानकारी कब साझा या स्थानांतरित की जा सकती है

हम व्यक्तिगत जानकारी “बेचते” नहीं हैं, और ट्रेनिंग डेटा में मौजूद व्यक्तिगत जानकारी का खुलासा केवल उन सीमित परिस्थितियों में करते हैं जिनका वर्णन हमारी प्राइवेसी पॉलिसी में किया गया है. उदाहरण के लिए, हम उन संबद्ध संस्थाओं, विक्रेताओं और सेवा प्रदाताओं के साथ जानकारी साझा कर सकते हैं, जो हमारे मॉडल के विकास, परीक्षण और सुधार में सहायता करते हैं. हम सच्चे मन से जानकारी का खुलासा भी कर सकते हैं कि ऐसी कार्रवाई किसी कानूनी दायित्व का पालन करने या हमारे अधिकारों, सुरक्षा तथा हमारे यूज़र्स, कर्मचारियों या जनता के अधिकारों, सुरक्षा की रक्षा करने के लिए आवश्यक है, जैसा कि हमारी प्राइवेसी पॉलिसी में बताया गया है.

चूँकि हमारा इन्फ्रास्ट्रक्चर वैश्विक है, प्रशिक्षण डेटा में मौजूद व्यक्तिगत जानकारी EEA, स्विट्ज़रलैंड या UK के बाहर के देशों (संयुक्त राज्य अमेरिका सहित) में संसाधित की जा सकती है. जहाँ ऐसा होता है, हम उपयुक्त सुरक्षा उपाय लागू करते हैं, जैसे पर्याप्तता संबंधी निर्णय या मानक संविदात्मक प्रावधान, जैसा कि हमारी प्राइवेसी पॉलिसी में वर्णित है.

अपने अधिकार और उनका प्रयोग कैसे करें

हम आपत्ति अनुरोधों और इसी तरह के अधिकार संबंधी अनुरोधों का जवाब देते हैं. भाषा सीखने के परिणामस्वरूप, ChatGPT के उत्तरों में कभी-कभी उन व्यक्तियों की व्यक्तिगत जानकारी शामिल हो सकती है, जिनकी जानकारी सार्वजनिक इंटरनेट पर कई बार दिखाई देती है (जैसे, सार्वजनिक व्यक्ति). कुछ न्यायक्षेत्रों में रहने वाले व्यक्ति हमारे मॉडल द्वारा अपनी व्यक्तिगत जानकारी के प्रसंस्करण पर आपत्ति जता सकते हैं या हमारे प्राइवेसी पोर्टल के माध्यम से डेटा अधिकारों से जुड़े अन्य अनुरोध कर सकते हैं. आप privacy@openai.com पर संपर्क करके भी इन अधिकारों का प्रयोग कर सकते हैं.

आपके अनुरोध का आकलन करने और उसका जवाब देने में हमारी मदद करने के लिए, कृपया हमें इतनी जानकारी प्रदान करें कि हम समझ सकें कि आपका अनुरोध किस व्यक्तिगत जानकारी से संबंधित है, जैसे आपका नाम, संबंधित URL, मॉडल आउटपुट के विशिष्ट उदाहरण, या अन्य विवरण जो समस्या की पहचान करने में मदद करें. कुछ मामलों में, कार्रवाई करने से पहले हम आपसे आपकी पहचान सत्यापित करने या यह पुष्टि करने के लिए कह सकते हैं कि जानकारी आपसे संबंधित है. इन अनुरोधों को प्रस्तुत करने के तरीके के बारे में अधिक जानकारी, जिनमें सर्वोत्तम प्रथाएँ और अनुरोधों की समीक्षा कैसे की जाती है, ChatGPT से व्यक्तिगत डेटा हटाने पर हमारे हेल्प सेंटर लेख में उपलब्ध है. हम अनुरोधों की समीक्षा लागू प्राइवेसी कानूनों के अनुसार करते हैं और लागू कानूनी समय-सीमाओं के भीतर जवाब देते हैं.

कृपया ध्यान दें कि प्राइवेसी कानूनों के अनुसार, कुछ अधिकार पूर्ण नहीं हो सकते हैं. उदाहरण के लिए, हम किसी ऐसे अनुरोध को पूरा नहीं कर सकते जहाँ हम संबंधित जानकारी सत्यापित न कर सकें, जहाँ अनुरोध OpenAI द्वारा संसाधित व्यक्तिगत जानकारी से संबंधित न हो, जहाँ कोई छूट लागू हो, या जहाँ ऐसा करने के लिए हमारे पास कोई अन्य वैध कारण हो. अनुरोधों का आकलन प्रत्येक मामले के आधार पर किया जाता है और इसमें प्राइवेसी अधिकारों और अभिव्यक्ति की स्वतंत्रता तथा सार्वजनिक हित जैसे अन्य महत्वपूर्ण विचारों के बीच संतुलन बनाना शामिल हो सकता है.

हालांकि, हम व्यक्तिगत जानकारी की सुरक्षा को प्राथमिकता देने और सभी लागू गोपनीयता कानूनों का पालन करने का प्रयास करते हैं. अगर आपको लगता है कि हमने किसी समस्या का पर्याप्त समाधान नहीं किया है, तो आपको अपने स्थानीय पर्यवेक्षी प्राधिकरण के पास शिकायत दर्ज करने का अधिकार है.

हमारी वेबसाइट, एप्लिकेशन और सेवाओं का उपयोग करते समय हम आपसे या आपके बारे में जो व्यक्तिगत जानकारी एकत्र करते हैं, उसके संबंध में OpenAI की प्रथाओं के बारे में अधिक जानकारी के लिए, कृपया हमारी प्राइवेसी पॉलिसी देखें.

ChatGPT और हमारे फाउंडेशन मॉडल कैसे विकसित किए जाते हैं

ChatGPT क्या है और यह कैसे काम करता है?

ChatGPT को सिखाने के लिए किस प्रकार की जानकारी का उपयोग किया जाता है?

क्या ChatGPT को सिखाने के लिए व्यक्तिगत जानकारी का उपयोग किया जाता है?

ChatGPT का विकास गोपनीयता कानूनों का पालन कैसे करता है?

क्या यह लेख मददगार था?