OpenAI
هذه الصفحة مترجمة باستخدام الترجمة الآلية. تفضل بالاطّلاع على المقال الأصلي بالإنجليزية.

الأسئلة الشائعة حول التضمينات

الأسئلة الشائعة حول نماذج التضمين الجديدة والمحسّنة

تم التحديث: 8 days ago

في 25 يناير 2024، أصدرنا نموذجين جديدين للتضمين: text-embedding-3-small وtext-embedding-3-large. هذه هي أحدث نماذج التضمين لدينا وأكثرها أداءً، مع تكاليف أقل وأداء أعلى متعدد اللغات ومعلمة جديدة لتقصير التضمينات. اقرأ المزيد.

ما المختلف في أحدث نماذج التضمين؟

توفر أحدث نماذجنا من الإصدار v3 أداءً أقوى في معايير القياس الشائعة وبسعر أقل. يمكنك قراءة المزيد عن تحسينات الأداء في منشور مدونة الإعلان ووثائق المطوّرين.

كيف يمكنني معرفة عدد الرموز التي ستتضمنها سلسلة نصية قبل أن أحاول تضمينها؟

يمكنك استخدام حزمة Tiktoken من OpenAI للتحقق من عدد الرموز التي ستتضمنها سلسلة نصية. تعرّف على المزيد في دليل المطوّرين للتضمينات لدينا.

كيف يمكنني استرجاع أقرب K من متجهات التضمين بسرعة؟

للبحث بسرعة ضمن العديد من المتجهات، نوصي باستخدام قاعدة بيانات متجهية.

ما دالة المسافة التي ينبغي أن أستخدمها؟

تكون مخرجات التضمين في OpenAI API مطبَّعة وفق L2 إلى طول 1 افتراضيًا، بما في ذلك بعد تقصيرها باستخدام المعلمة dimensions، ما يعني أن:

تكون تضمينات OpenAI مطبَّعة إلى طول 1، ما يعني أن:

  • يمكن حساب تشابه جيب التمام بسرعة أكبر قليلًا باستخدام حاصل الضرب النقطي فقط

  • سيؤدي تشابه جيب التمام والمسافة الإقليدية إلى الترتيبات نفسها

هل كانت هذه المقالة مفيدة؟