एम्बेडिंग्स FAQ

नए और बेहतर एम्बेडिंग मॉडल के लिए FAQ

25 जनवरी 2024 को हमने दो नए एम्बेडिंग मॉडल जारी किए: text-embedding-3-small और text-embedding-3-large. ये कम लागत, बेहतर बहुभाषी प्रदर्शन और एम्बेडिंग को छोटा करने के लिए एक नए पैरामीटर के साथ हमारे सबसे नए और सर्वश्रेष्ठ प्रदर्शन वाले एम्बेडिंग मॉडल हैं. और पढ़ें.

नवीनतम एम्बेडिंग मॉडल में क्या अलग है?

हमारे नवीनतम v3 मॉडल कम कीमत पर सामान्य बेंचमार्क पर बेहतर प्रदर्शन देते हैं. आप प्रदर्शन में हुए सुधारों के बारे में घोषणा ब्लॉग पोस्ट और डेवलपर दस्तावेज़ में और पढ़ सकते हैं.

किसी स्ट्रिंग को एम्बेड करने से पहले मुझे कैसे पता चलेगा कि उसमें कितने टोकन होंगे?

आप OpenAI का Tiktoken पैकेज इस्तेमाल करके देख सकते हैं कि किसी स्ट्रिंग में कितने टोकन होंगे. हमारी एम्बेडिंग डेवलपर गाइड में और जानें.

मैं K निकटतम एम्बेडिंग वेक्टर जल्दी से कैसे प्राप्त कर सकता हूँ?

कई वेक्टरों में जल्दी खोज करने के लिए, हम वेक्टर डेटाबेस का उपयोग करने की सलाह देते हैं.

मुझे कौन-सा दूरी फ़ंक्शन इस्तेमाल करना चाहिए?

OpenAI API के एम्बेडिंग आउटपुट, dimensions पैरामीटर से छोटा करने के बाद भी, डिफ़ॉल्ट रूप से लंबाई 1 तक L2-नॉर्मलाइज़ किए जाते हैं, जिसका मतलब है कि:

OpenAI एम्बेडिंग्स लंबाई 1 तक नॉर्मलाइज़ की जाती हैं, जिसका मतलब है कि:

कोसाइन समानता की गणना केवल डॉट प्रोडक्ट का उपयोग करके थोड़ी तेज़ी से की जा सकती है
कोसाइन समानता और यूक्लिडियन दूरी से बिल्कुल समान रैंकिंग मिलेंगी

एम्बेडिंग्स FAQ

नवीनतम एम्बेडिंग मॉडल में क्या अलग है?

किसी स्ट्रिंग को एम्बेड करने से पहले मुझे कैसे पता चलेगा कि उसमें कितने टोकन होंगे?

मैं K निकटतम एम्बेडिंग वेक्टर जल्दी से कैसे प्राप्त कर सकता हूँ?

मुझे कौन-सा दूरी फ़ंक्शन इस्तेमाल करना चाहिए?

क्या यह लेख मददगार था?