OpenAI
هذه الصفحة مترجمة باستخدام الترجمة الآلية. تفضل بالاطّلاع على المقال الأصلي بالإنجليزية.

تحسين تحميل الملفات في ChatGPT Enterprise

افهم كيف تتعامل ميزات ChatGPT Enterprise مع الملفات حسب نوعها وعددها وحجمها. حسّن النتائج بناءً على متطلبات الملفات.

تم التحديث: 12 days ago

يدعم ChatGPT Enterprise الآن قراءة المرئيات وفهمها (الصور، والرسوم البيانية، والمخططات، وما إلى ذلك) المضمّنة في ملفات PDF المدرجة في المطالبات. يمكن للمستخدمين تحميل ملف PDF، ويمكن لـ ChatGPT تفسير النص و أي عناصر مرئية داخل ذلك الملف.

للتفاصيل، راجع الأسئلة الشائعة حول الاسترجاع المرئي مع ملفات PDF.

يتيح لك ChatGPT Enterprise تحميل الملفات بعدة طرق:

يشرح هذا الدليل كيف تتعامل ميزات ChatGPT Enterprise مع الملفات حسب نوعها وعددها وحجمها، ويناقش استراتيجيات تحسين النتائج بناءً على متطلبات الملفات.

الملخص

يتعامل ChatGPT Enterprise مع أنواع الملفات المختلفة بطرق متباينة جدًا: فيستخرج النص من المستندات النصية مثل ملفات PDF والعروض التقديمية وملفات Word، ويحلل البيانات المنظمة من جداول البيانات باستخدام تعليمات Python البرمجية، ويصف ملفات الصور عبر GPT-Vision. إن فهم نوع الملف الذي يفعّل سير العمل المناسب هو مفتاح الحصول على النتيجة المتوقعة.

بالنسبة إلى المستندات النصية، يضمّن ChatGPT Enterprise أكبر قدر ممكن من النص ذي الصلة مباشرةً إلى جانب المطالبة، ويستخدم نظام بحث للوصول إلى معلومات إضافية. ينجح هذا جيدًا في الإجابة عن أسئلة محددة. ومع ذلك، قد يواجه هذا النهج صعوبة في المهام المعقدة مثل تلخيص مستندات كبيرة جدًا أو مقارنة عدة ملفات كبيرة. تابع القراءة لفهم استراتيجيات تحسين نتائجك.

التعامل مع الملفات حسب النوع

يعالج ChatGPT Enterprise الملفات بثلاث طرق رئيسية: استخراج النص، وتحليل التعليمات البرمجية، وتفسير الصور. يحدد نوع الملف سير العمل الذي يتبعه ChatGPT Enterprise.

الاسترجاع المستند إلى النصمنفّذ التعليمات البرمجيةمعالجة الصورالاسترجاع المرئي
أمثلة على أنواع الملفاتpptx, docx, txt, md, json, xml, pdf*
* ملفات PDF المحمّلة بصفتها

معرفة GPT
أو

ملفات مشروع
csv, xls, xlsx*
*ملاحظة: يمكن لمنفّذ التعليمات البرمجية العمل على أي نوع ملف، لكن ChatGPT Enterprise يعتمد غالبًا CI افتراضيًا لجداول البيانات
jpg, pngpdf*
* ملفات PDF المضمّنة في مطالبات المستخدم
السلوكيستخرج النص من الملف – يُلصق بعض النص («يُحشى») مباشرةً في نطاق السياق؛ ويُخزن بعض النص للبحثيمرر منفّذ التعليمات البرمجية الملف إلى Python للمعالجةتُفسَّر الصور أصليًا بواسطة نماذج متعددة الأنماط، مع مراعاة

القيود المعروفة
.
مزيج من استرجاع النص ومعالجة الصور. يُستخرج النص رقميًا، ويُفسَّر المحتوى المرئي أصليًا بواسطة نماذج متعددة الأنماط.

بالنسبة إلى الملفات النصية فقط، أو ملفات الصور، أو ملفات البيانات المنظمة بوضوح (مثل جدول Excel للمعاملات)، تمثل هذه التقسيمات أفضل سلوك ممكن.

هناك بعض المناطق الرمادية الأقل وضوحًا، مثل:

  • لا تتم معالجة الصور المضمّنة في ملفات غير ملفات PDF. لإدراجها، حوّل الملف إلى PDF قبل التحميل.

  • سيستخدم ChatGPT Enterprise دائمًا منفّذ التعليمات البرمجية للتفاعل مع جداول البيانات، حتى إذا كان المستند يحتوي على قدر كبير من النص. على سبيل المثال، إذا طلبت من ChatGPT Enterprise ترجمة ملف CSV يحتوي على 10 صفوف من النص، فسيحاول ترجمة الملف باستخدام مكتبة Python، وهي أقل دقة من السماح للنموذج بإنشاء الترجمة مباشرةً. للتخفيف من ذلك، جرّب تصدير جدول البيانات إلى تنسيق نصي (PDF، على سبيل المثال).

  • وبالمثل، إذا حمّلت جدول معاملات منظمًا موصوفًا داخل ملف JSON، فسيفسر ChatGPT Enterprise هذا الملف كنص عادي. إذا كنت تريد تحليل البيانات الموجودة في ملف JSON، فاطلب من النموذج استخدام منفّذ التعليمات البرمجية في مطالبتك.

التعامل مع الملفات حسب الحجم

يستخدم ChatGPT Enterprise نماذج ذات نطاق سياق أقصى يبلغ 128 ألف رمز (نحو 200 صفحة من النص). ومع ذلك، لا تُستخدم كل الرموز لإدراج النص من الملفات المحمّلة. يختلف عدد الرموز «المحشوة» بحسب نوع الاستخدام.

يقوم ChatGPT Enterprise «بحشو» قدر من النص، ويُرسل النص المتبقي إلى فهرس بحث خاص («مخزن متجهات»، وهو نوع من قواعد البيانات مصمم لتخزين كميات كبيرة من النص واسترجاعها بكفاءة). عندما تطرح سؤالًا، يجلب ChatGPT Enterprise النص المضمّن مع المقاطع ذات الصلة المسترجعة من فهرس بحث خاص.

إذا حمّلت مستندًا واحدًا، يضمّن ChatGPT Enterprise النص بدءًا من البداية حتى يبلغ حدّه. إذا حمّلت عدة مستندات، يضمّن ChatGPT Enterprise بعض كل مستند أو كله. ويُرسل كل النص من المستندات أيضًا إلى فهرس بحث خاص.

حشو السياق للمستندات النصية

هذه الميزة قيد التطوير النشط. لذلك، قد تتغير التفاصيل التالية دون إشعار.

يمكن لـ ChatGPT Enterprise معالجة ما يصل إلى 110 آلاف رمز من المستندات المحمّلة في نطاق السياق. إذا حمّلت مستندًا واحدًا أو أكثر بإجمالي مدمج يقل عن 110 آلاف رمز، فسيتم تضمين المحتوى الكامل.

بالنسبة إلى مستند واحد يتجاوز 110 آلاف رمز، لن يُضمَّن إلا أول 110 آلاف رمز، بدءًا من البداية. سيُرسل ما تبقى إلى فهرس البحث الخاص فقط.

إذا حُمّلت عدة مستندات وتجاوز إجماليها المدمج 110 آلاف رمز، يستخدم ChatGPT Enterprise عملية من خطوتين لموازنة تمثيل المستندات:

  1. استخرج ما يصل إلى 55 ألف رمز، مقسّمة بالتساوي بين المستندات المحمّلة.

  1. بالنسبة إلى المستندات غير الممثلة بالكامل في الخطوة الأولى، خصّص الـ 55 ألف رمز المتبقية بشكل متناسب بناءً على الرموز المتبقية في كل مستند.

  1. تُرسل أي رموز متبقية إلى فهرس البحث الخاص فقط.

يمكنك تقدير عدد الرموز في مستند نصي بنسخ نص المستند إلى مُقسّم الرموز من OpenAI.

حشو السياق لملفات PDF متعددة الوسائط

عندما يحمّل المستخدمون ملفات PDF تحتوي على نصوص وصور، تتيح الاسترجاع المرئي لـ ChatGPT معالجة هذه الصور أصليًا إلى جانب النص المستخرج رقميًا. تُكمّل الخطوات التالية إجراءاتنا القياسية لمعالجة السياق لملفات PDF متعددة الوسائط:

  • استخراج الصور وتضمينها: تُستخرج الصور وتُضمَّن مع النص الرقمي المرتبط بها.

  • التحجيم الذكي: تُضبط أحجام الصور تلقائيًا للحفاظ على توازن بين جودة المعلومات والاستخدام الفعّال لنطاق السياق المتاح.

عندما تتجاوز ملفات PDF المحمّلة حد 110 آلاف رمز، تُضمَّن الصور والنصوص في فهرس البحث الخاص. تشير تضمينات النص إلى الصور ذات الصلة، مما يسمح لـ ChatGPT باسترجاع أزواج النص والصورة المناسبة بناءً على استعلامات المستخدم. ثم تُعالَج الصور المسترجعة باستخدام قدرات ChatGPT الأصلية المتعددة الأنماط.

يصعب تقدير متطلبات الرموز بدقة لملفات PDF متعددة الوسائط. تشير الاختبارات إلى أن نحو 350 صفحة من النصوص والصور المختلطة ستستخدم نطاق سياق 110 آلاف رمز بالكامل.

استراتيجيات البحث حسب نوع النموذج

تدعم كل من نماذج سلسلة GPT ونماذج سلسلة o تحميل الملفات، وتستخدم منطقًا متطابقًا لحشو السياق وتضمينات البحث. تنفّذ جميع النماذج عمليات بحث هجينة على فهرس بحث خاص، يجمع بين أساليب الكلمات المفتاحية والأساليب الدلالية. في البحث الهجين، ينشئ النموذج عبارة بحث بناءً على مطالبة المستخدم، ويسترجع فهرس البحث الخاص النصوص والصور ذات الصلة وفقًا لذلك.

ومع ذلك، تختلف هذه النماذج في طريقة بحثها داخل المستندات الكبيرة التي تتجاوز نطاق السياق:

نماذج سلسلة GPT

  • بحث واحد لكل مطالبة: تجري نماذج سلسلة GPT عملية بحث واحدة لكل مطالبة من المستخدم.

  • حالات الاستخدام الفعالة: مثالية للإجابة عن أسئلة مباشرة مضمّنة في وثائق واسعة.

أمثلة على الاستعلامات:

  • «ما سياسة الموارد البشرية للتقاعد المبكر؟»

  • «ما الذي تفعله الدالة process_order؟»

نماذج سلسلة o

  • عمليات بحث متعددة لكل مطالبة: يمكنها تنفيذ عمليات بحث متعددة (عادةً 2-3) لكل مطالبة من المستخدم، ولكل منها عبارة بحث فريدة. تُنفَّذ عمليات البحث بالتسلسل، ويمكن للنموذج تحديث نهجه بناءً على المعلومات المسترجعة في عمليات البحث السابقة.

  • حالات الاستخدام الفعالة: أكثر ملاءمة للأسئلة المعقدة التي تتطلب عمليات بحث موجّهة متعددة عبر وثائق واسعة.

أمثلة على الاستعلامات:

  • «ما سياسات الموارد البشرية للتقاعد المبكر، وإجازة الوالدين، والنقل إلى الخارج؟»

  • «اشرح ما تفعله الدالة process_order، واسرد كل الطرق التي تستدعيها هذه الدالة، وصف بإيجاز كل طريقة مستدعاة.»

رغم نقاط قوتها، قد تواجه نماذج سلسلة o صعوبة عندما يتطلب الاستعلام أكثر من ثلاث عمليات بحث.

نصائح لتحسين نتائج البحث في الملفات

  • جرّب استخدام نموذج من سلسلة o للأسئلة المعقدة التي تتطلب عمليات بحث متعددة.

  • تذكّر أن الردود قد تختلف حسب نوع المستندات التي تحمّلها وعددها وحجمها.

  • عمومًا، سيؤدي تحميل عدد أقل من المستندات المركّزة إلى دقة أعلى.

  • حوّل الموضوعات متعددة الأسئلة إلى أسئلة منفردة:

    • إذا كنت بحاجة إلى معرفة سياسات الموارد البشرية في كل ولاية، فاسأل عنها واحدة تلو الأخرى.

    • إذا كنت بحاجة إلى تلخيص مستندات كثيرة، فاطلب مستندًا واحدًا في كل مرة. إذا كان ذلك المستند يتكون من مئات الصفحات الكثيرة، ففكّر في تقسيمه إلى مكونات أصغر.

      • يمكنك أن تطلب من ChatGPT Enterprise كتابة «ملخص للملخصات» إذا زوّدته بعدة ملخصات بدلًا من مستندات كاملة.

    • إذا كان لديك ملف CSV لطلب عرض RFP (كل سطر سؤال مختلف)، فاطرح تلك الأسئلة واحدًا تلو الآخر بدلًا من تحميل ملف CSV وطلب رد واحد.

  • ابحث عن طرق لتدقيق ردود النموذج. فيما يلي مثال على تعليمات GPT:

# السياق 

أنت خبير في فهم المستندات. سيُرفق المستخدم مستندًا ويطرح سؤالًا. يجب أن يكون قادرًا على ربط إجابتك بالجزء الدقيق من النص الذي أخذت منه إجابتك.

# التعليمات

1. أجب عن سؤال المستخدم بناءً على المستند المرفق باستخدام التنسيق الدقيق الوارد أدناه

# التنسيق

- السؤال: { repeat user's question }
- الإجابة: { provide an answer to user's question }
المصدر:
- - رقم القسم: { provide section number where you pulled in the answer }
- - عنوان القسم: { provide section title where you pulled in the answer }
- - النص الدقيق: { provide the exact text where you pulled the answer from }

# القواعد

- قدّم إجابات واضحة وموجزة
- لا تقدّم إلا المعلومات الواردة في المستند
- إذا لم تتمكن من العثور على الإجابة في المستند، فأجب ببساطة «لم يتم العثور على معلومات.»

هل كانت هذه المقالة مفيدة؟