ফাইলের ধরন, সংখ্যা ও আকার অনুযায়ী ChatGPT Enterprise ফিচারগুলো কীভাবে ফাইল পরিচালনা করে তা বুঝুন। ফাইলের প্রয়োজন অনুযায়ী আউটপুট উন্নত করুন.

ChatGPT Enterprise এখন প্রম্পটে অন্তর্ভুক্ত PDF ফাইলের ভেতরে থাকা ভিজ্যুয়াল (ছবি, গ্রাফ, ডায়াগ্রাম ইত্যাদি) পড়া ও বোঝা সমর্থন করে. ব্যবহারকারীরা একটি PDF আপলোড করতে পারেন, এবং ChatGPT সেই ফাইলের টেক্সট ও যেকোনো ভিজ্যুয়াল উপাদান ব্যাখ্যা করতে পারে.

বিস্তারিত জানতে PDF-সহ ভিজ্যুয়াল রিট্রিভাল FAQ দেখুন.

ChatGPT Enterprise আপনাকে কয়েকভাবে ফাইল আপলোড করতে দেয়:

সরাসরি আপনার কম্পিউটার থেকে
Google Drive / SharePoint / OneDrive থেকে
GPT Knowledge হিসেবে
প্রজেক্ট ফাইল হিসেবে
GPT অ্যাকশন থেকে

এই গাইডে ব্যাখ্যা করা হয়েছে ChatGPT Enterprise ফিচারগুলো কীভাবে ফাইলের ধরন, সংখ্যা ও আকার অনুযায়ী ফাইল পরিচালনা করে, এবং ফাইলের প্রয়োজনীয়তার ভিত্তিতে আউটপুট উন্নত করার কৌশল আলোচনা করা হয়েছে.

সারসংক্ষেপ

ChatGPT Enterprise বিভিন্ন ফাইলের ধরনকে খুব ভিন্নভাবে বিবেচনা করে: PDF, প্রেজেন্টেশন ও Word ফাইলের মতো টেক্সট ডকুমেন্ট থেকে টেক্সট বের করা, Python কোড ব্যবহার করে স্প্রেডশিটের গঠিত ডেটা বিশ্লেষণ করা, এবং GPT-Vision-এর মাধ্যমে ইমেজ ফাইল বর্ণনা করা. কোন ফাইলের ধরন কোন ওয়ার্কফ্লো চালু করে তা বোঝাই প্রত্যাশিত ফলাফল পাওয়ার মূল চাবিকাঠি.

টেক্সট-ভিত্তিক ডকুমেন্টের জন্য, ChatGPT Enterprise প্রম্পটের পাশাপাশি যতটা সম্ভব প্রাসঙ্গিক টেক্সট সরাসরি অন্তর্ভুক্ত করে এবং অতিরিক্ত তথ্য অ্যাক্সেস করতে একটি সার্চ সিস্টেম ব্যবহার করে. নির্দিষ্ট প্রশ্নের উত্তর দেওয়ার ক্ষেত্রে এটি ভালো কাজ করে. তবে, খুব বড় ডকুমেন্ট সারসংক্ষেপ করা বা একাধিক বড় ফাইল তুলনা করার মতো জটিল কাজে এই পদ্ধতিটি অসুবিধায় পড়তে পারে. আপনার ফলাফল উন্নত করার কৌশল বুঝতে পড়তে থাকুন.

ধরন অনুযায়ী ফাইল পরিচালনা

ChatGPT Enterprise তিনটি প্রধান উপায়ে ফাইল প্রক্রিয়া করে: টেক্সট এক্সট্রাকশন, কোড বিশ্লেষণ এবং ইমেজ ব্যাখ্যা. ফাইলের ধরন নির্ধারণ করে ChatGPT Enterprise কোন ওয়ার্কফ্লো অনুসরণ করবে.

	টেক্সট-ভিত্তিক রিট্রিভাল	কোড ইন্টারপ্রিটার	ইমেজ প্রসেসিং	ভিজ্যুয়াল রিট্রিভাল
ফাইলের ধরনের উদাহরণ	pptx, docx, txt, md, json, xml, pdf* * PDF আপলোড করা হয়েছে GPT Knowledge বা প্রজেক্ট ফাইল হিসেবে	csv, xls, xlsx* *নোট: কোড ইন্টারপ্রিটার যেকোনো ফাইলের ধরনে কাজ করতে পারে, তবে ChatGPT Enterprise সাধারণত স্প্রেডশিটের জন্য CI-তে ডিফল্ট করে	jpg, png	pdf* * ব্যবহারকারীর প্রম্পটে অন্তর্ভুক্ত PDF
আচরণ	ফাইল থেকে টেক্সট বের করে – কিছু টেক্সট সরাসরি কনটেক্সট উইন্ডোতে পেস্ট (“স্টাফ”) করা হয়; কিছু টেক্সট সার্চের জন্য সংরক্ষণ করা হয়	কোড ইন্টারপ্রিটার প্রক্রিয়াকরণের জন্য ফাইলটি Python-এ পাঠায়	ইমেজগুলো মাল্টি-মোডাল মডেল দ্বারা নেটিভভাবে ব্যাখ্যা করা হয়, পরিচিত সীমাবদ্ধতা সাপেক্ষে.	টেক্সট রিট্রিভাল এবং ইমেজ প্রসেসিংয়ের একটি হাইব্রিড. টেক্সট ডিজিটালভাবে বের করা হয়, এবং ভিজ্যুয়াল কনটেন্ট মাল্টি-মোডাল মডেল দ্বারা নেটিভভাবে ব্যাখ্যা করা হয়.

শুধু টেক্সট ফাইল, ইমেজ ফাইল, অথবা স্পষ্টভাবে গঠিত ডেটা ফাইলের ক্ষেত্রে (যেমন, লেনদেনের একটি Excel টেবিল), এই বিভাজনগুলো সম্ভাব্য সেরা আচরণ নির্দেশ করে.

কিছু অস্পষ্ট ক্ষেত্র আছে, যেগুলো কম স্পষ্ট, যেমন:

PDF ছাড়া অন্য ফাইলে এমবেড করা ছবি প্রক্রিয়া করা হয় না. সেগুলো অন্তর্ভুক্ত করতে, আপলোড করার আগে ফাইলটিকে PDF-এ রূপান্তর করুন.
ডকুমেন্টে প্রচুর টেক্সট থাকলেও, ChatGPT Enterprise স্প্রেডশিটের সঙ্গে ইন্টারঅ্যাক্ট করতে সবসময় কোড ইন্টারপ্রিটার ব্যবহার করবে. উদাহরণস্বরূপ, আপনি যদি ChatGPT Enterprise-কে ১০ সারি টেক্সটসহ একটি CSV ফাইল অনুবাদ করতে বলেন, এটি একটি Python লাইব্রেরি ব্যবহার করে ফাইলটি অনুবাদ করার চেষ্টা করবে, যা মডেলকে সরাসরি অনুবাদ তৈরি করতে দেওয়ার তুলনায় কম নির্ভুল. এটি কমাতে, স্প্রেডশিটটি টেক্সট-ভিত্তিক ফরম্যাটে (যেমন PDF) এক্সপোর্ট করার চেষ্টা করুন.
একইভাবে, আপনি যদি JSON ফাইলে থাকা বর্ণিত কোনো গঠিত লেনদেনের টেবিল আপলোড করেন, ChatGPT Enterprise এই ফাইলটিকে প্লেইন টেক্সট হিসেবে ব্যাখ্যা করবে. আপনি যদি JSON ফাইলে থাকা ডেটা বিশ্লেষণ করতে চান, প্রম্পটে মডেলকে কোড ইন্টারপ্রিটার ব্যবহার করতে নির্দেশ দিন.

আকার অনুযায়ী ফাইল পরিচালনা

ChatGPT Enterprise সর্বোচ্চ 128k টোকেনের কনটেক্সট উইন্ডোসহ মডেল ব্যবহার করে (প্রায় ২০০ পৃষ্ঠার টেক্সট). তবে, আপলোড করা ফাইলের টেক্সট অন্তর্ভুক্ত করতে সব টোকেন ব্যবহার করা হয় না. “স্টাফড” টোকেনের সংখ্যা ব্যবহারের ধরন অনুযায়ী পরিবর্তিত হয়.

ChatGPT Enterprise কিছু পরিমাণ টেক্সট “স্টাফ” করে, এবং বাকি টেক্সট একটি প্রাইভেট সার্চ ইনডেক্সে পাঠানো হয় (একটি “ভেক্টর স্টোর”, যা এমন এক ধরনের ডাটাবেস যা দক্ষতার সঙ্গে বিপুল পরিমাণ টেক্সট সংরক্ষণ ও উদ্ধার করার জন্য তৈরি). আপনি প্রশ্ন করলে, ChatGPT Enterprise অন্তর্ভুক্ত টেক্সটের সঙ্গে প্রাইভেট সার্চ ইনডেক্স থেকে উদ্ধার করা প্রাসঙ্গিক অংশগুলোও নিয়ে আসে.

আপনি যদি একটি মাত্র ডকুমেন্ট আপলোড করেন, ChatGPT Enterprise শুরু থেকে টেক্সট অন্তর্ভুক্ত করে যতক্ষণ না তার সীমায় পৌঁছায়. আপনি একাধিক ডকুমেন্ট আপলোড করলে, ChatGPT Enterprise প্রতিটি ডকুমেন্টের কিছু বা সব অংশ অন্তর্ভুক্ত করে. ডকুমেন্টগুলোর সব টেক্সটও একটি প্রাইভেট সার্চ ইনডেক্সে পাঠানো হয়.

টেক্সট ডকুমেন্টের জন্য কনটেক্সট স্টাফিং

এই ফিচারটি সক্রিয় উন্নয়নাধীন। তাই, নিচের বিস্তারিত তথ্য পূর্ব নোটিশ ছাড়াই পরিবর্তিত হতে পারে.

ChatGPT Enterprise আপলোড করা ডকুমেন্ট থেকে কনটেক্সট উইন্ডোতে সর্বোচ্চ 110k টোকেন প্রক্রিয়া করতে পারে. আপনি যদি এক বা একাধিক ডকুমেন্ট আপলোড করেন, যেগুলোর মোট যোগফল 110k টোকেনের কম, তাহলে সম্পূর্ণ কনটেন্ট অন্তর্ভুক্ত করা হবে.

একটি ডকুমেন্ট 110k টোকেনের বেশি হলে, শুরু থেকে শুধু প্রথম 110k টোকেন অন্তর্ভুক্ত করা হবে. বাকি অংশ শুধু প্রাইভেট সার্চ ইনডেক্সে পাঠানো হবে.

যদি একাধিক ডকুমেন্ট আপলোড করা হয় এবং সেগুলোর মোট যোগফল 110k টোকেনের বেশি হয়, ChatGPT Enterprise ডকুমেন্টের প্রতিনিধিত্বের ভারসাম্য রাখতে দুই ধাপের প্রক্রিয়া ব্যবহার করে:

আপলোড করা ডকুমেন্টগুলোর মধ্যে সমানভাবে ভাগ করে সর্বোচ্চ 55k টোকেন বের করুন.

প্রথম ধাপে পুরোপুরি প্রতিনিধিত্ব না পাওয়া ডকুমেন্টগুলোর জন্য, প্রতিটি ডকুমেন্টে বাকি থাকা টোকেনের ভিত্তিতে অবশিষ্ট 55k টোকেন আনুপাতিকভাবে বরাদ্দ করুন.

যে টোকেনগুলো বাকি থাকে, সেগুলো শুধু প্রাইভেট সার্চ ইনডেক্সে পাঠানো হয়.

কোনো টেক্সট ডকুমেন্টে টোকেনের সংখ্যা অনুমান করতে ডকুমেন্টের টেক্সট OpenAI টোকেনাইজার-এ কপি করতে পারেন.

মাল্টিমিডিয়া PDF-এর জন্য কনটেক্সট স্টাফিং

ব্যবহারকারীরা যখন টেক্সট ও ছবি উভয়ই থাকা PDF আপলোড করেন, ভিজ্যুয়াল রিট্রিভাল ChatGPT-কে ডিজিটালভাবে বের করা টেক্সটের পাশাপাশি এই ছবিগুলো নেটিভভাবে প্রক্রিয়া করতে সক্ষম করে. নিচের ধাপগুলো মাল্টিমিডিয়া PDF-এর জন্য আমাদের স্ট্যান্ডার্ড কনটেক্সট-হ্যান্ডলিং পদ্ধতিকে সম্পূরক করে:

ইমেজ এক্সট্রাকশন ও এমবেডিং: ছবিগুলো বের করা হয় এবং সংশ্লিষ্ট ডিজিটাল টেক্সটের সঙ্গে এমবেড করা হয়.
ইন্টেলিজেন্ট স্কেলিং: তথ্যের মান এবং উপলভ্য কনটেক্সট উইন্ডোর দক্ষ ব্যবহারের মধ্যে ভারসাম্য রাখতে ছবিগুলো স্বয়ংক্রিয়ভাবে স্কেল করা হয়.

আপলোড করা PDF 110k টোকেন সীমা ছাড়িয়ে গেলে, ছবি ও টেক্সট উভয়ই প্রাইভেট সার্চ ইনডেক্সে এমবেড করা হয়. টেক্সট এমবেডিংগুলো প্রাসঙ্গিক ছবির রেফারেন্স রাখে, ফলে ChatGPT ব্যবহারকারীর প্রশ্নের ভিত্তিতে উপযুক্ত টেক্সট-ইমেজ জোড়া উদ্ধার করতে পারে. উদ্ধার করা ছবিগুলো এরপর ChatGPT-এর নেটিভ মাল্টিমোডাল সক্ষমতা ব্যবহার করে প্রক্রিয়া করা হয়.

মাল্টিমিডিয়া PDF-এর জন্য টোকেনের প্রয়োজনীয়তা সঠিকভাবে অনুমান করা কঠিন. পরীক্ষায় দেখা যায় যে মিশ্র টেক্সট ও ছবির প্রায় ৩৫০ পৃষ্ঠা 110k টোকেনের কনটেক্সট উইন্ডো পুরোপুরি ব্যবহার করবে.

মডেলের ধরন অনুযায়ী সার্চ কৌশল

GPT-সিরিজ এবং o-সিরিজ উভয় মডেলই ফাইল আপলোড সমর্থন করে এবং একই কনটেক্সট স্টাফিং ও সার্চ এমবেডিং লজিক ব্যবহার করে. সব মডেলই একটি প্রাইভেট সার্চ ইনডেক্সে হাইব্রিড সার্চ চালায়, যেখানে কীওয়ার্ড ও সেমান্টিক পদ্ধতি একসঙ্গে ব্যবহার করা হয়. হাইব্রিড সার্চে, মডেল ব্যবহারকারীর প্রম্পটের ভিত্তিতে একটি সার্চ বাক্যাংশ তৈরি করে, এবং প্রাইভেট সার্চ ইনডেক্স সেই অনুযায়ী প্রাসঙ্গিক টেক্সট ও ছবি উদ্ধার করে.

তবে, কনটেক্সট উইন্ডো ছাড়িয়ে যায় এমন বড় ডকুমেন্টে কীভাবে সার্চ করা হয়, সে ক্ষেত্রে এই মডেলগুলোর পার্থক্য আছে:

GPT-সিরিজের মডেল

প্রতি প্রম্পটে একবার সার্চ: GPT-সিরিজের মডেলগুলো প্রতি ব্যবহারকারীর প্রম্পটে একটি সার্চ করে.
কার্যকর ব্যবহারের ক্ষেত্র: বিস্তৃত ডকুমেন্টেশনে থাকা সরল প্রশ্নের উত্তর দেওয়ার জন্য আদর্শ.

উদাহরণ প্রশ্ন:

“আগাম অবসরের জন্য HR নীতি কী?”
“process_order ফাংশনটি কী করে?”

o-সিরিজের মডেল

প্রতি প্রম্পটে একাধিক সার্চ: প্রতিটি ব্যবহারকারীর প্রম্পটে একাধিক সার্চ (সাধারণত ২–৩টি) চালাতে পারে, প্রতিটির জন্য আলাদা সার্চ বাক্যাংশ থাকে. সার্চগুলো ধারাবাহিকভাবে চালানো হয়, এবং আগের সার্চে পাওয়া তথ্যের ভিত্তিতে মডেল তার পদ্ধতি আপডেট করতে পারে.
কার্যকর ব্যবহারের ক্ষেত্র: বিস্তৃত ডকুমেন্টেশন জুড়ে একাধিক লক্ষ্যভিত্তিক সার্চ দরকার এমন জটিল প্রশ্নের জন্য বেশি উপযোগী.

উদাহরণ প্রশ্ন:

“আগাম অবসর, পিতামাতার ছুটি এবং বিদেশে বদলির জন্য HR নীতিগুলো কী?”
“process_order ফাংশনটি কী করে তা ব্যাখ্যা করুন, এই ফাংশন দ্বারা আহ্বান করা সব মেথড তালিকাভুক্ত করুন এবং প্রতিটি আহ্বান করা মেথড সংক্ষেপে বর্ণনা করুন.”

শক্তি থাকা সত্ত্বেও, কোনো প্রশ্নের জন্য তিনটির বেশি সার্চ দরকার হলে o-সিরিজের মডেলগুলো অসুবিধায় পড়তে পারে.

ফাইল সার্চের ফলাফল উন্নত করার টিপস

একাধিক সার্চ দরকার এমন জটিল প্রশ্নের জন্য o-সিরিজের মডেল ব্যবহার করে দেখুন.
মনে রাখবেন, আপনার আপলোড করা ডকুমেন্টের ধরন, সংখ্যা ও আকার অনুযায়ী প্রতিক্রিয়া ভিন্ন হতে পারে.
সাধারণত, কম সংখ্যক ও বেশি লক্ষ্যভিত্তিক ডকুমেন্ট লোড করলে নির্ভুলতা বেশি হবে.
বহু-প্রশ্নের বিষয়কে একক প্রশ্নে রূপান্তর করুন:
- আপনার যদি প্রতিটি অঙ্গরাজ্যের HR নীতি জানতে হয়, একে একে জিজ্ঞাসা করুন.
- অনেক ডকুমেন্ট সারসংক্ষেপ করতে হলে, একবারে একটি ডকুমেন্টের জন্য জিজ্ঞাসা করুন. যদি সেই ডকুমেন্টটি বহু শত পৃষ্ঠার হয়, এটিকে ছোট ছোট অংশে ভাগ করার কথা ভাবুন.
  - সম্পূর্ণ ডকুমেন্টের বদলে একাধিক সারসংক্ষেপ দিলে, আপনি ChatGPT Enterprise-কে “সারসংক্ষেপের সারসংক্ষেপ” লিখতে বলতে পারেন.
- আপনার কাছে যদি কোনো RFP-এর CSV থাকে (প্রতিটি লাইনে আলাদা প্রশ্ন), শুধু CSV লোড করে একটি উত্তর চাওয়ার বদলে প্রশ্নগুলো একে একে জিজ্ঞাসা করুন.
মডেলের প্রতিক্রিয়া অডিট করার উপায় খুঁজুন. উদাহরণ GPT নির্দেশনা নিচে দেওয়া আছে:

# প্রসঙ্গ 

আপনি ডকুমেন্ট বোঝার ক্ষেত্রে একজন বিশেষজ্ঞ। ব্যবহারকারী একটি ডকুমেন্ট সংযুক্ত করবেন এবং একটি প্রশ্ন করবেন। তাদের এমনভাবে আপনার উত্তর দরকার যাতে আপনি উত্তরটি টেক্সটের ঠিক কোন অংশ থেকে নিয়েছেন, সেটির সাথে তারা সংযোগ করতে পারেন.

# নির্দেশনা

1. নিচে দেওয়া সঠিক ফরম্যাট ব্যবহার করে সংযুক্ত ডকুমেন্টের ভিত্তিতে ব্যবহারকারীর প্রশ্নের উত্তর দিন.

# ফরম্যাট 

- Question: { ব্যবহারকারীর প্রশ্নটি পুনরাবৃত্তি করুন }
- Answer: { ব্যবহারকারীর প্রশ্নের উত্তর দিন }
Source: 
- - Section Number: { যে section number থেকে আপনি উত্তর নিয়েছেন তা দিন }
- - Section Title: { যে section title থেকে আপনি উত্তর নিয়েছেন তা দিন }
- - Exact Text: { যে সঠিক টেক্সট থেকে আপনি উত্তর নিয়েছেন তা দিন }

# নিয়ম

- উত্তরগুলো স্পষ্ট ও সংক্ষিপ্ত রাখুন
- ডকুমেন্টে দেওয়া তথ্যই শুধু প্রদান করুন
- আপনি যদি ডকুমেন্টে উত্তরটি খুঁজে না পান, তাহলে শুধু উত্তর দিন “কোনো তথ্য পাওয়া যায়নি.”

ChatGPT Enterprise-এ ফাইল আপলোড অপ্টিমাইজ করা

সারসংক্ষেপ

ধরন অনুযায়ী ফাইল পরিচালনা

আকার অনুযায়ী ফাইল পরিচালনা

টেক্সট ডকুমেন্টের জন্য কনটেক্সট স্টাফিং

মাল্টিমিডিয়া PDF-এর জন্য কনটেক্সট স্টাফিং

মডেলের ধরন অনুযায়ী সার্চ কৌশল

GPT-সিরিজের মডেল

o-সিরিজের মডেল

ফাইল সার্চের ফলাফল উন্নত করার টিপস

এই নিবন্ধটি কি সহায়ক ছিল?