OpenAI
यह पेज मशीन द्वारा अनुवादित है. मूल अंग्रेज़ी आर्टिकल देखें.

OpenAI ओपन-वेट मॉडल (gpt-oss)

OpenAI के ओपन-वेट मॉडलों (gpt-oss) और सहायता पाने के स्थानों के बारे में जानें

अपडेट किया गया: 15 hours ago

नोट: यह लेख एक उच्च-स्तरीय अवलोकन देता है. तकनीकी सेटअप की जानकारी gpt-oss वेबसाइट, GitHub, Hugging Face, और OpenAI Cookbooks पर मिल सकती है.

अवलोकन

दो ओपन-वेट रीज़निंग मॉडल पेश कर रहे हैं: gpt‑oss‑120b और gpt‑oss‑20b. ये आपके नियंत्रण वाले इंफ़्रास्ट्रक्चर पर, या होस्टिंग प्रदाताओं के ज़रिए चलते हैं.

नोट: ये मॉडल OpenAI API के ज़रिए सर्व नहीं किए जाते और ChatGPT में उपलब्ध नहीं हैं.

ओपन-वेट क्यों

  • चयन और नियंत्रण: मॉडलों को ऑन-प्रिमाइसेस या अपने निजी क्लाउड में चलाएं, डेटा रेज़िडेंसी बनाए रखें, और अपनी ज़रूरतों के अनुसार प्रदर्शन को ढालें.

  • कस्टमाइज़ेशन: अपने पसंदीदा ओपन टूलिंग के साथ मॉडलों को फ़ाइन-ट्यून या अनुकूलित करें.

उपलब्धता और लाइसेंसिंग

  • लाइसेंस: Apache 2.0 व्यापक उपयोग, संशोधन और पुनर्वितरण की अनुमति देता है, जिसमें व्यावसायिक उपयोग भी शामिल है (हमारी gpt-oss उपयोग नीति के अधीन).

  • सर्विंग: OpenAI API के ज़रिए उपलब्ध नहीं है, इसलिए API मूल्य निर्धारण और रेट लिमिट लागू नहीं होतीं.

  • संगतता: vLLM, Ollama, llama.cpp जैसे सामान्य ओपन इन्फ़रेंस स्टैक के साथ, और क्लाउड या स्वयं-प्रबंधित GPU वातावरणों में चलाया जा सकता है.

शुरू करना

मॉडल वेट और सहायक संसाधन पाने के लिए, आप ये कर सकते हैं:

  • अवलोकन और सीधे लिंक के लिए gpt-oss वेबसाइट पर जाएं.

  • Hugging Face संग्रह से वेट डाउनलोड करें — यह एक सामुदायिक हब है जहां आप दोनों मॉडल पा सकते हैं, उपयोग के उदाहरण देख सकते हैं, और वैकल्पिक रूप से Hugging Face की सेवाओं के ज़रिए सीधे इन्फ़रेंस चला सकते हैं.

  • संदर्भ इन्फ़रेंस कोड के लिए हमारे GitHub रेपो तक पहुंचें.

  • Ollama, vLLM और Transformers जैसे समर्थित रनटाइम के साथ सेटअप के लिए OpenAI Cookbook की गाइड का उपयोग करें. Cookbook में स्थानीय रूप से चलाने, सामान्य रनटाइम का उपयोग करने और—जहां समर्थित हो—gpt‑oss मॉडलों को फ़ाइन-ट्यून करने के लिए चरण-दर-चरण निर्देश भी शामिल हैं.

gpt‑oss‑safeguard (रिसर्च प्रीव्यू)

gpt‑oss‑safeguard, gpt‑oss के ऊपर बनाए गए ओपन-वेट सुरक्षा रीज़निंग मॉडलों की एक जोड़ी है. इन्हें नीति-आधारित सुरक्षा वर्गीकरण और संबंधित भरोसा व सुरक्षा कार्यों के लिए डिज़ाइन किया गया है, जिन्हें आप अपने नियंत्रण वाले इंफ़्रास्ट्रक्चर पर चलाते हैं. अन्य gpt‑oss मॉडलों की तरह, ये वेट OpenAI API या ChatGPT के ज़रिए सर्व नहीं किए जाते.

  • संदर्भ स्ट्रक्चर्ड-आउटपुट स्कीमा (जैसे, नीति निर्णय, तर्क) के साथ केवल-टेक्स्ट मॉडल.

  • अपनी नीति लाएं: मॉडल आपकी लिखित नीति को समझता है, ताकि वह न्यूनतम इंजीनियरिंग के साथ उत्पादों में सामान्यीकृत हो सके.

  • तर्कसंगत निर्णय: डिबगिंग और ऑडिट में मदद के लिए वैकल्पिक रीज़निंग ट्रेस (डेवलपर और सुरक्षा विशेषज्ञों के लिए, अंतिम उपयोगकर्ता को दिखाने के लिए नहीं).

  • कॉन्फ़िगर करने योग्य रीज़निंग प्रयास: विलंबता बनाम गहराई में संतुलन के लिए low / medium / high चुनें.

  • लाइसेंस: Apache 2.0 (नीचे उपलब्धता और लाइसेंसिंग देखें).

gpt‑oss‑safeguard LLMs के लिए इनपुट/आउटपुट फ़िल्टरिंग, ऑनलाइन कंटेंट लेबलिंग और ऑफ़लाइन बैच लेबलिंग या समीक्षा वर्कफ़्लो के लिए उपयुक्त है. सामान्य एप्लिकेशन (चैट, एजेंट आदि) के लिए, हम मुख्य gpt‑oss मॉडलों की अनुशंसा करते हैं.

आप स्कीमा को अपनी ज़रूरतों के अनुसार अनुकूलित कर सकते हैं. प्रॉम्प्टिंग और उदाहरणों पर गाइड के लिए कृपया OpenAI Cookbook देखें.

मॉडल वैरिएंट और आकार

| मॉडल | उद्दिष्ट उपयोग | नोट | | gpt‑oss‑safeguard‑120b | उत्पादन, उच्च-क्षमता सुरक्षा रीज़निंग | 117B पैरामीटर (≈5.1B सक्रिय). <br>एकल 80 GB GPU<br> पर फ़िट होने के लिए डिज़ाइन किया गया (जैसे, NVIDIA H100; AMD MI300X जैसे अधिक-मेमोरी GPU पर भी चलता है). | | gpt‑oss‑safeguard‑20b | कम-विलंबता / सीमित वातावरण | 21B पैरामीटर (≈3.6B सक्रिय). |

दोनों मॉडल बिना किसी आर्किटेक्चर बदलाव के gpt‑oss से फ़ाइन-ट्यून किए गए हैं. वे gpt‑oss जैसा ही चैट टेम्पलेट उपयोग करते हैं; आप अपना मौजूदा सेटअप बनाए रख सकते हैं. अनुशंसित प्रॉम्प्टिंग पैटर्न है कि अपनी नीति को डेवलपर संदेश में और मूल्यांकन किए जाने वाले कंटेंट को उपयोगकर्ता संदेश में रखें.

सहायता और समुदाय

ओपन-वेट डिप्लॉयमेंट स्वयं प्रबंधित और स्वयं सेवित होते हैं. सहायता पाने के स्थान यहां दिए गए हैं:

  • प्रश्न, चर्चा, सुझाव: समुदाय से जुड़ने के लिए Hugging Face मॉडल पेज का उपयोग करें.

  • OpenAI के संदर्भ इन्फ़रेंस कोड में पुनरुत्पादित किए जा सकने वाले बग: gpt-oss GitHub रेपो पर समस्या खोलें.

  • किसी तृतीय-पक्ष रनटाइम (जैसे, vLLM, Ollama, llama.cpp) से जुड़ी समस्याएं: संबंधित प्रोजेक्ट के इश्यू ट्रैकर, फ़ोरम या सहायता प्रक्रिया का उपयोग करें.

OpenAI किसी भी स्वयं-होस्टेड या तृतीय-पक्ष-होस्टेड ओपन-वेट सेटअप, कॉन्फ़िगरेशन, वातावरण या एप्लिकेशन के लिए सहायता, हैंड्स-ऑन इम्प्लीमेंटेशन या डिबगिंग सहायता प्रदान नहीं करता.

हम ROOST Model Community (RMC) सहित समुदाय के साथ मिलकर ओपन सुरक्षा टूलिंग को बेहतर बनाने के लिए निरंतर पुनरावृत्ति करते रहेंगे. RMC सुरक्षा विशेषज्ञों और शोधकर्ताओं को एक साथ लाता है ताकि वे मूल्यांकन परिणामों और मॉडल फ़ीडबैक सहित सुरक्षा वर्कफ़्लो में ओपन सोर्स AI मॉडलों को लागू करने की सर्वोत्तम प्रक्रियाएं साझा कर सकें. इस साझेदारी और इसमें शामिल होने के तरीके के बारे में अधिक जानने के लिए RMC GitHub रेपो पर जाएं.

सहायता और समुदाय

ओपन-वेट डिप्लॉयमेंट स्वयं प्रबंधित और स्वयं सेवित होते हैं. सहायता पाने के स्थान यहां दिए गए हैं:

  • प्रश्न, चर्चा, सुझाव: समुदाय से जुड़ने के लिए Hugging Face मॉडल पेज का उपयोग करें.

  • OpenAI के संदर्भ इन्फ़रेंस कोड में पुनरुत्पादित किए जा सकने वाले बग: gpt-oss GitHub रेपो पर समस्या खोलें.

  • किसी तृतीय-पक्ष रनटाइम (जैसे, vLLM, Ollama, llama.cpp) से जुड़ी समस्याएं: संबंधित प्रोजेक्ट के इश्यू ट्रैकर, फ़ोरम या सहायता प्रक्रिया का उपयोग करें.

OpenAI किसी भी स्वयं-होस्टेड या तृतीय-पक्ष-होस्टेड ओपन-वेट सेटअप, कॉन्फ़िगरेशन, वातावरण या एप्लिकेशन के लिए सहायता, हैंड्स-ऑन इम्प्लीमेंटेशन या डिबगिंग सहायता प्रदान नहीं करता.

गोपनीयता और सुरक्षा

गोपनीयता और डेटा

ये मॉडल आपके नियंत्रण वाले इंफ़्रास्ट्रक्चर (ऑन-प्रिमाइसेस या आपके क्लाउड या होस्टिंग पार्टनर में) पर चलने के लिए डिज़ाइन किए गए हैं. OpenAI आपके द्वारा इन स्वयं-होस्टेड मॉडलों को भेजे गए डेटा को प्राप्त या प्रोसेस नहीं करता, जब तक कि आप उसे स्पष्ट रूप से OpenAI के साथ साझा न करें, या हमारे किसी प्रबंधित होस्टिंग पार्टनर का उपयोग न करें.

सुरक्षा

इन मॉडलों ने व्यापक सुरक्षा प्रशिक्षण और परीक्षण से गुज़रा है. अधिक विवरण के लिए, हमारा मॉडल कार्ड और तकनीकी रिपोर्ट देखें.

कंटेंट उल्लंघनों की रिपोर्ट करना

अगर आपको लगता है कि gpt‑oss मॉडलों से जनरेट किया गया कंटेंट हमारी नीतियों का उल्लंघन करता है, तो आप हमारे Report Content फ़ॉर्म के ज़रिए इसकी रिपोर्ट कर सकते हैं. कृपया हमारी टीम को आपके सबमिशन की समीक्षा में मदद करने के लिए यथासंभव अधिक विवरण दें.

अक्सर पूछे जाने वाले प्रश्न

क्या ये मॉडल मुफ़्त हैं?

gpt-oss मॉडल वेट Apache 2.0 लाइसेंस और gpt-oss उपयोग नीति के तहत डाउनलोड और उपयोग करने के लिए मुफ़्त हैं. हालांकि, इन्हें चलाने से जुड़ी किसी भी लागत—जैसे कंप्यूट, स्टोरेज या तृतीय-पक्ष होस्टिंग शुल्क—के लिए आप ज़िम्मेदार हैं. उनका मूल्य निर्धारण आपके चुने हुए इंफ़्रास्ट्रक्चर या प्रदाता पर निर्भर करेगा.

क्या ये मॉडल “ओपन सोर्स” हैं?

हम ओपन मॉडल या ओपन-वेट शब्दों का उपयोग यह बताने के लिए करते हैं कि प्रशिक्षित वेट उदार Apache 2.0 लाइसेंस और gpt-oss उपयोग नीति के तहत सार्वजनिक रूप से उपलब्ध हैं. इसका अर्थ है कि आप मॉडल डाउनलोड कर सकते हैं, उन्हें अपने इंफ़्रास्ट्रक्चर या समर्थित होस्टिंग फ़्रेमवर्क के साथ चला सकते हैं, और उन्हें कस्टमाइज़ या फ़ाइन-ट्यून कर सकते हैं.

ओपन मॉडल डेवलपरों और संगठनों को अधिक नियंत्रण और लचीलापन देते हैं. आप चुन सकते हैं कि कहां होस्ट करना है, मॉडलों को विशिष्ट उपयोग मामलों के लिए अनुकूलित कर सकते हैं, और ऐसे लाइसेंसिंग का लाभ उठा सकते हैं जो व्यापक उपयोग, संशोधन और पुनर्वितरण की अनुमति देता है. हालांकि प्रशिक्षित वेट खुले हैं, कुछ आसपास का इंफ़्रास्ट्रक्चर या टूलिंग उनके प्रदाताओं के स्वामित्व में रह सकती है.

क्या मैं इन मॉडलों को OpenAI API या ChatGPT के ज़रिए एक्सेस कर सकता हूं?

नहीं. ये मॉडल OpenAI API में सर्व नहीं किए जाते और ChatGPT में दिखाई नहीं देते.

क्या मैं मॉडलों को फ़ाइन-ट्यून कर सकता हूं?

हां. आप ओपन-सोर्स टूल और अपने पसंदीदा इंफ़्रास्ट्रक्चर का उपयोग करके फ़ाइन-ट्यून कर सकते हैं. हम इन मॉडलों के लिए OpenAI APIs के ज़रिए फ़ाइन-ट्यूनिंग की पेशकश नहीं करते.

क्या ओपन-वेट मॉडल API के उपयोग से सस्ते हैं?

लागत इंफ़्रास्ट्रक्चर, वर्कलोड और संचालन के तरीके पर निर्भर करती है. कुछ मामलों में स्वयं-होस्टिंग सस्ती हो सकती है, जबकि होस्टिंग, रखरखाव और अपग्रेड को ध्यान में रखने पर हमारा API Platform अधिक प्रभावी हो सकता है.

ये मॉडल किन सुविधाओं का समर्थन करते हैं?

ये मॉडल वर्तमान में केवल-टेक्स्ट रीज़निंग मॉडल हैं. सामान्य रनटाइम स्ट्रीमिंग, फ़ंक्शन कॉलिंग और स्ट्रक्चर्ड आउटपुट का समर्थन करते हैं. सटीक क्षमताओं के लिए अपने रनटाइम का दस्तावेज़ देखें.

यह ModAPI से कैसे अलग है?

यह एक अत्यंत सक्षम रीज़निंग मॉडल है जो आपको अपनी नीति लाने की अनुमति देता है. यह ModAPI के साथ मिलकर काम कर सकता है, लेकिन कम-विलंबता उपयोग मामलों के लिए शायद उसका विकल्प नहीं है.

क्या यह लेख मददगार था?