OpenAI
यह पेज मशीन द्वारा अनुवादित है. मूल अंग्रेज़ी आर्टिकल देखें.

ChatGPT Enterprise में फ़ाइल अपलोड को ऑप्टिमाइज़ करना

समझें कि ChatGPT Enterprise की सुविधाएँ फ़ाइलों को उनके प्रकार, संख्या और आकार के आधार पर कैसे संभालती हैं. फ़ाइल आवश्यकताओं के आधार पर आउटपुट बेहतर बनाएँ.

अपडेट किया गया: 15 days ago

ChatGPT Enterprise अब प्रॉम्प्ट में शामिल PDF फ़ाइलों में एम्बेड किए गए विज़ुअल (इमेज, ग्राफ़, आरेख आदि) पढ़ने और समझने का समर्थन करता है. उपयोगकर्ता PDF अपलोड कर सकते हैं, और ChatGPT उस फ़ाइल के टेक्स्ट और किसी भी विज़ुअल तत्व की व्याख्या कर सकता है.

विवरण के लिए PDF के साथ विज़ुअल रिट्रीवल FAQ. देखें

ChatGPT Enterprise आपको कई तरीकों से फ़ाइलें अपलोड करने देता है:

यह गाइड बताती है कि ChatGPT Enterprise की सुविधाएँ फ़ाइलों को उनके प्रकार, संख्या और आकार के आधार पर कैसे संभालती हैं, और फ़ाइल आवश्यकताओं के आधार पर आउटपुट बेहतर बनाने की रणनीतियों पर चर्चा करती है.

सारांश

ChatGPT Enterprise अलग-अलग फ़ाइल प्रकारों को बहुत अलग तरीके से संभालता है: PDF, प्रेज़ेंटेशन और Word फ़ाइलों जैसे टेक्स्ट दस्तावेज़ों से टेक्स्ट निकालना, Python कोड का उपयोग करके स्प्रेडशीट से संरचित डेटा का विश्लेषण करना, और GPT-Vision के माध्यम से इमेज फ़ाइलों का वर्णन करना. कौन-सा फ़ाइल प्रकार कौन-सा वर्कफ़्लो शुरू करता है, यह समझना अपेक्षित परिणाम पाने की कुंजी है.

टेक्स्ट-आधारित दस्तावेज़ों के लिए, ChatGPT Enterprise जितना संभव हो उतना प्रासंगिक टेक्स्ट सीधे प्रॉम्प्ट के साथ शामिल करता है और अतिरिक्त जानकारी तक पहुँचने के लिए खोज प्रणाली का उपयोग करता है. यह विशिष्ट प्रश्नों के उत्तर देने के लिए अच्छी तरह काम करता है. हालाँकि, बहुत बड़े दस्तावेज़ों का सारांश बनाना या कई बड़ी फ़ाइलों की तुलना करना जैसे जटिल कार्यों में यह तरीका संघर्ष कर सकता है. अपने परिणाम बेहतर बनाने की रणनीतियाँ समझने के लिए आगे पढ़ें.

प्रकार के आधार पर फ़ाइलों को संभालना

ChatGPT Enterprise फ़ाइलों को तीन मुख्य तरीकों से प्रोसेस करता है: टेक्स्ट निकालना, कोड विश्लेषण और इमेज व्याख्या. फ़ाइल प्रकार यह तय करता है कि ChatGPT Enterprise कौन-सा वर्कफ़्लो अपनाता है.

टेक्स्ट-आधारित पुनर्प्राप्तिकोड इंटरप्रेटरइमेज प्रोसेसिंगविज़ुअल रिट्रीवल
फ़ाइल प्रकार के उदाहरणpptx, docx, txt, md, json, xml, pdf*
* PDF जिन्हें

GPT नॉलेज
या

प्रोजेक्ट फ़ाइलों के रूप में अपलोड किया गया हो
csv, xls, xlsx*
*नोट: कोड इंटरप्रेटर किसी भी फ़ाइल प्रकार पर काम कर सकता है, लेकिन ChatGPT Enterprise आमतौर पर स्प्रेडशीट के लिए डिफ़ॉल्ट रूप से CI का उपयोग करता है
jpg, pngpdf*
* उपयोगकर्ता प्रॉम्प्ट में शामिल PDF
व्यवहारफ़ाइल से टेक्स्ट निकालता है – कुछ टेक्स्ट सीधे कॉन्टेक्स्ट विंडो में चिपकाया (“स्टफ़” किया) जाता है; कुछ टेक्स्ट खोज के लिए संग्रहीत होता हैकोड इंटरप्रेटर फ़ाइल को प्रोसेसिंग के लिए Python को पास करता हैइमेज को मल्टी-मोडल मॉडल द्वारा नेटिव रूप से समझा जाता है, जो

ज्ञात सीमाओं
के अधीन है.
टेक्स्ट पुनर्प्राप्ति और इमेज प्रोसेसिंग का मिश्रण. टेक्स्ट डिजिटल रूप से निकाला जाता है, और विज़ुअल सामग्री को मल्टी-मोडल मॉडल द्वारा नेटिव रूप से समझा जाता है.

केवल-टेक्स्ट फ़ाइलों, इमेज फ़ाइलों या स्पष्ट रूप से संरचित डेटा फ़ाइलों (जैसे, लेनदेन की Excel तालिका) के लिए, ये विभाजन सर्वोत्तम संभव व्यवहार दिखाते हैं.

कुछ धुंधले क्षेत्र भी हैं जो कम स्पष्ट हैं, उदाहरण के लिए:

  • PDF के अलावा अन्य फ़ाइलों में एम्बेड की गई इमेज प्रोसेस नहीं की जातीं. उन्हें शामिल करने के लिए, अपलोड करने से पहले फ़ाइल को PDF में बदलें.

  • ChatGPT Enterprise स्प्रेडशीट के साथ इंटरैक्ट करने के लिए हमेशा कोड इंटरप्रेटर का उपयोग करेगा, भले ही दस्तावेज़ में बहुत अधिक टेक्स्ट हो. उदाहरण के लिए, यदि आप ChatGPT Enterprise से टेक्स्ट की 10 पंक्तियों वाली CSV फ़ाइल का अनुवाद करने को कहते हैं, तो यह Python लाइब्रेरी का उपयोग करके फ़ाइल का अनुवाद करने का प्रयास करेगा, जो मॉडल को सीधे अनुवाद बनाने देने की तुलना में कम सटीक है. इसे कम करने के लिए, स्प्रेडशीट को किसी टेक्स्ट-आधारित फ़ॉर्मैट (उदाहरण के लिए PDF) में निर्यात करने का प्रयास करें.

  • इसी तरह, यदि आप JSON फ़ाइल में शामिल वर्णित संरचित लेनदेन तालिका अपलोड करते हैं, तो ChatGPT Enterprise इस फ़ाइल को सादे टेक्स्ट के रूप में समझेगा. यदि आप JSON फ़ाइल में मौजूद डेटा का विश्लेषण करना चाहते हैं, तो अपने प्रॉम्प्ट में मॉडल को कोड इंटरप्रेटर का उपयोग करने का निर्देश दें.

आकार के आधार पर फ़ाइलों को संभालना

ChatGPT Enterprise अधिकतम 128k टोकन की कॉन्टेक्स्ट विंडो (लगभग 200 पेज टेक्स्ट) वाले मॉडल का उपयोग करता है. हालाँकि, अपलोड की गई फ़ाइलों के टेक्स्ट को शामिल करने के लिए सभी टोकन का उपयोग नहीं किया जाता. “स्टफ़ किए गए” टोकन की संख्या उपयोग के प्रकार के अनुसार बदलती है.

ChatGPT Enterprise कुछ मात्रा में टेक्स्ट “स्टफ़” करता है, और बचा हुआ टेक्स्ट निजी खोज इंडेक्स (एक “वेक्टर स्टोर”, जो बड़ी मात्रा में टेक्स्ट को कुशलता से संग्रहीत और पुनः प्राप्त करने के लिए डिज़ाइन किया गया डेटाबेस है) को भेजा जाता है. जब आप कोई प्रश्न पूछते हैं, तो ChatGPT Enterprise शामिल टेक्स्ट के साथ-साथ निजी खोज इंडेक्स से प्राप्त प्रासंगिक हिस्से लाता है.

यदि आप एक ही दस्तावेज़ अपलोड करते हैं, तो ChatGPT Enterprise शुरुआत से टेक्स्ट शामिल करता है, जब तक वह अपनी सीमा तक नहीं पहुँच जाता. यदि आप कई दस्तावेज़ अपलोड करते हैं, तो ChatGPT Enterprise हर दस्तावेज़ का कुछ या पूरा हिस्सा शामिल करता है. दस्तावेज़ों का पूरा टेक्स्ट निजी खोज इंडेक्स को भी भेजा जाता है.

टेक्स्ट दस्तावेज़ों के लिए कॉन्टेक्स्ट स्टफ़िंग

यह सुविधा सक्रिय विकास के अधीन है. इसलिए, निम्न विवरण बिना सूचना के बदल सकते हैं.

ChatGPT Enterprise कॉन्टेक्स्ट विंडो में अपलोड किए गए दस्तावेज़ों से 110k टोकन तक प्रोसेस कर सकता है. यदि आप एक या अधिक दस्तावेज़ अपलोड करते हैं जिनका संयुक्त कुल 110k टोकन से कम है, तो पूरी सामग्री शामिल की जाएगी.

110k टोकन से अधिक वाले एकल दस्तावेज़ के लिए, शुरुआत से केवल पहले 110k टोकन शामिल किए जाएँगे. बाकी हिस्सा केवल निजी खोज इंडेक्स को भेजा जाएगा.

यदि कई दस्तावेज़ अपलोड किए गए हैं और उनका संयुक्त कुल 110k टोकन से अधिक है, तो ChatGPT Enterprise दस्तावेज़ प्रतिनिधित्व को संतुलित करने के लिए दो-चरणीय प्रक्रिया का उपयोग करता है:

  1. 55k टोकन तक निकालें, जिन्हें अपलोड किए गए दस्तावेज़ों में समान रूप से बाँटा गया हो.

  1. जो दस्तावेज़ पहले चरण में पूरी तरह शामिल नहीं हुए, उनके लिए हर दस्तावेज़ में बचे टोकन के आधार पर बाकी 55k टोकन अनुपातिक रूप से आवंटित करें.

  1. बचे हुए कोई भी टोकन केवल निजी खोज इंडेक्स को भेजे जाते हैं.

आप किसी टेक्स्ट दस्तावेज़ में टोकन की संख्या का अनुमान दस्तावेज़ का टेक्स्ट OpenAI टोकनाइज़र में कॉपी करके लगा सकते हैं.

मल्टीमीडिया PDF के लिए कॉन्टेक्स्ट स्टफ़िंग

जब उपयोगकर्ता टेक्स्ट और इमेज, दोनों वाली PDF अपलोड करते हैं, तो विज़ुअल रिट्रीवल ChatGPT को इन इमेज को डिजिटल रूप से निकाले गए टेक्स्ट के साथ नेटिव रूप से प्रोसेस करने में सक्षम बनाता है. निम्न चरण मल्टीमीडिया PDF के लिए हमारी मानक कॉन्टेक्स्ट-हैंडलिंग प्रक्रियाओं को पूरक करते हैं:

  • इमेज निकालना और एम्बेड करना: इमेज निकाली जाती हैं और उनसे जुड़े डिजिटल टेक्स्ट के साथ एम्बेड की जाती हैं.

  • इंटेलिजेंट स्केलिंग: उपलब्ध कॉन्टेक्स्ट विंडो के कुशल उपयोग और जानकारी की गुणवत्ता के बीच संतुलन बनाए रखने के लिए इमेज अपने-आप स्केल की जाती हैं.

जब अपलोड की गई PDF 110k टोकन सीमा से अधिक होती हैं, तो इमेज और टेक्स्ट, दोनों निजी खोज इंडेक्स में एम्बेड किए जाते हैं. टेक्स्ट एम्बेडिंग प्रासंगिक इमेज का संदर्भ देती हैं, जिससे ChatGPT उपयोगकर्ता क्वेरी के आधार पर उपयुक्त टेक्स्ट-इमेज जोड़े प्राप्त कर सकता है. प्राप्त इमेज फिर ChatGPT की नेटिव मल्टी-मोडल क्षमताओं का उपयोग करके प्रोसेस की जाती हैं.

मल्टीमीडिया PDF के लिए टोकन आवश्यकताओं का सटीक अनुमान लगाना चुनौतीपूर्ण है. परीक्षण से पता चलता है कि मिश्रित टेक्स्ट और इमेज के लगभग 350 पेज 110k टोकन कॉन्टेक्स्ट विंडो का पूरा उपयोग करेंगे.

मॉडल प्रकार के आधार पर खोज रणनीतियाँ

GPT-सीरीज़ और o-सीरीज़, दोनों मॉडल फ़ाइल अपलोड का समर्थन करते हैं और समान कॉन्टेक्स्ट स्टफ़िंग और सर्च एम्बेडिंग लॉजिक का उपयोग करते हैं. सभी मॉडल निजी खोज इंडेक्स पर हाइब्रिड खोजें करते हैं, जिनमें कीवर्ड और सिमेंटिक तरीकों को मिलाया जाता है. हाइब्रिड खोज में, मॉडल उपयोगकर्ता के प्रॉम्प्ट के आधार पर खोज वाक्यांश बनाता है, और निजी खोज इंडेक्स उसी के अनुसार प्रासंगिक टेक्स्ट और इमेज प्राप्त करता है.

हालाँकि, ये मॉडल उन बड़े दस्तावेज़ों में खोज करने के तरीके में अलग होते हैं जो कॉन्टेक्स्ट विंडो से बड़े होते हैं:

GPT-सीरीज़ मॉडल

  • प्रत्येक प्रॉम्प्ट पर एक खोज: GPT-सीरीज़ मॉडल प्रत्येक उपयोगकर्ता प्रॉम्प्ट पर एक खोज करते हैं.

  • प्रभावी उपयोग के मामले: विस्तृत दस्तावेज़ों में मौजूद सीधे-सादे प्रश्नों के उत्तर देने के लिए आदर्श.

उदाहरण क्वेरी:

  • “समय से पहले सेवानिवृत्ति के लिए HR नीति क्या है?”

  • process_order फ़ंक्शन क्या करता है?”

o-सीरीज़ मॉडल

  • प्रत्येक प्रॉम्प्ट पर कई खोजें: प्रत्येक उपयोगकर्ता प्रॉम्प्ट पर कई खोजें (आमतौर पर 2-3) कर सकता है, जिनमें हर एक का खोज वाक्यांश अलग होता है. खोजें क्रम से की जाती हैं, और मॉडल पिछली खोजों में मिली जानकारी के आधार पर अपना तरीका अपडेट कर सकता है.

  • प्रभावी उपयोग के मामले: विस्तृत दस्तावेज़ों में कई लक्षित खोजों की आवश्यकता वाले जटिल प्रश्नों के लिए अधिक उपयुक्त.

उदाहरण क्वेरी:

  • “समय से पहले सेवानिवृत्ति, अभिभावकीय अवकाश और विदेश स्थानांतरण के लिए HR नीतियाँ क्या हैं?”

  • “समझाएँ कि process_order फ़ंक्शन क्या करता है, इस फ़ंक्शन द्वारा कॉल की गई सभी विधियों की सूची दें, और हर कॉल की गई विधि का संक्षिप्त वर्णन करें.”

अपनी खूबियों के बावजूद, o-सीरीज़ मॉडल को तब कठिनाई हो सकती है जब किसी क्वेरी के लिए तीन से अधिक खोजों की आवश्यकता हो.

फ़ाइल खोज परिणाम बेहतर बनाने के सुझाव

  • कई खोजों की आवश्यकता वाले जटिल प्रश्नों के लिए o-सीरीज़ मॉडल का उपयोग करके देखें.

  • याद रखें कि प्रतिक्रियाएँ आपके द्वारा अपलोड किए गए दस्तावेज़ों के प्रकार, संख्या और आकार के आधार पर बदल सकती हैं.

  • आम तौर पर, कम और केंद्रित दस्तावेज़ लोड करने से सटीकता अधिक होगी.

  • कई-प्रश्न वाले विषयों को एकल प्रश्नों में बदलें:

    • यदि आपको हर राज्य की HR नीतियाँ जाननी हैं, तो उन्हें एक-एक करके पूछें.

    • यदि आपको कई दस्तावेज़ों का सारांश चाहिए, तो एक बार में एक दस्तावेज़ के लिए पूछें. यदि वह दस्तावेज़ कई सौ पेज का है, तो उसे छोटे घटकों में बाँटने पर विचार करें.

      • यदि आपने पूरे दस्तावेज़ों के बजाय कई सारांश दिए हैं, तो आप ChatGPT Enterprise से “सारांशों का सारांश” लिखने को कह सकते हैं.

    • यदि आपके पास किसी RFP की CSV है (हर पंक्ति अलग प्रश्न है), तो CSV लोड करके एक ही उत्तर माँगने के बजाय उन प्रश्नों को एक-एक करके पूछें.

  • मॉडल की प्रतिक्रियाओं का ऑडिट करने के तरीके खोजें. उदाहरण GPT निर्देश नीचे दिए गए हैं:

# संदर्भ 

आप दस्तावेज़ों को समझने में विशेषज्ञ हैं. उपयोगकर्ता एक दस्तावेज़ संलग्न करेगा और एक प्रश्न पूछेगा. उन्हें आपके उत्तर को टेक्स्ट के ठीक उसी भाग से जोड़ पाने की आवश्यकता है जहाँ से आपने अपना उत्तर लिया है.

# निर्देश

1. नीचे दिए गए ठीक प्रारूप का उपयोग करके, उपयोगकर्ता के संलग्न दस्तावेज़ के आधार पर उसके प्रश्न का उत्तर दें

# प्रारूप

- प्रश्न: { repeat user's question }
- उत्तर: { provide an answer to user's question }
स्रोत:
- - अनुभाग संख्या: { provide section number where you pulled in the answer }
- - अनुभाग शीर्षक: { provide section title where you pulled in the answer }
- - सटीक टेक्स्ट: { provide the exact text where you pulled the answer from }

# नियम

- स्पष्ट और संक्षिप्त उत्तर दें
- केवल दस्तावेज़ में दी गई जानकारी दें
- यदि आपको दस्तावेज़ में उत्तर नहीं मिल पाता है, तो बस “कोई जानकारी नहीं मिली.” उत्तर दें

क्या यह लेख मददगार था?