25 जनवरी 2024 को हमने दो नए एम्बेडिंग मॉडल जारी किए: text-embedding-3-small और text-embedding-3-large. ये कम लागत, बेहतर बहुभाषी प्रदर्शन और एम्बेडिंग को छोटा करने के लिए एक नए पैरामीटर के साथ हमारे सबसे नए और सर्वश्रेष्ठ प्रदर्शन वाले एम्बेडिंग मॉडल हैं. और पढ़ें.
नवीनतम एम्बेडिंग मॉडल में क्या अलग है?
हमारे नवीनतम v3 मॉडल कम कीमत पर सामान्य बेंचमार्क पर बेहतर प्रदर्शन देते हैं. आप प्रदर्शन में हुए सुधारों के बारे में घोषणा ब्लॉग पोस्ट और डेवलपर दस्तावेज़ में और पढ़ सकते हैं.
किसी स्ट्रिंग को एम्बेड करने से पहले मुझे कैसे पता चलेगा कि उसमें कितने टोकन होंगे?
आप OpenAI का Tiktoken पैकेज इस्तेमाल करके देख सकते हैं कि किसी स्ट्रिंग में कितने टोकन होंगे. हमारी एम्बेडिंग डेवलपर गाइड में और जानें.
मैं K निकटतम एम्बेडिंग वेक्टर जल्दी से कैसे प्राप्त कर सकता हूँ?
कई वेक्टरों में जल्दी खोज करने के लिए, हम वेक्टर डेटाबेस का उपयोग करने की सलाह देते हैं.
मुझे कौन-सा दूरी फ़ंक्शन इस्तेमाल करना चाहिए?
OpenAI API के एम्बेडिंग आउटपुट, dimensions पैरामीटर से छोटा करने के बाद भी, डिफ़ॉल्ट रूप से लंबाई 1 तक L2-नॉर्मलाइज़ किए जाते हैं, जिसका मतलब है कि:
OpenAI एम्बेडिंग्स लंबाई 1 तक नॉर्मलाइज़ की जाती हैं, जिसका मतलब है कि:
कोसाइन समानता की गणना केवल डॉट प्रोडक्ट का उपयोग करके थोड़ी तेज़ी से की जा सकती है
कोसाइन समानता और यूक्लिडियन दूरी से बिल्कुल समान रैंकिंग मिलेंगी
