নোট: এই নিবন্ধটি একটি উচ্চ-স্তরের সংক্ষিপ্ত বিবরণ দেয়. প্রযুক্তিগত সেটআপের তথ্য gpt-oss ওয়েবসাইট, GitHub, Hugging Face, এবং OpenAI Cookbooks-এ পাওয়া যাবে.
সংক্ষিপ্ত বিবরণ
দুটি ওপেন-ওয়েট যুক্তিবিশ্লেষণ মডেল পরিচয় করিয়ে দেওয়া হচ্ছে: gpt‑oss‑120b এবং gpt‑oss‑20b. এগুলো আপনার নিয়ন্ত্রণাধীন অবকাঠামোতে, অথবা হোস্টিং প্রদানকারীদের মাধ্যমে চলে.
নোট: এই মডেলগুলো OpenAI API-এর মাধ্যমে সার্ভ করা হয় না এবং ChatGPT-এ উপলভ্য নয়.
ওপেন-ওয়েট কেন
পছন্দ ও নিয়ন্ত্রণ: অন-প্রিমাইসেস বা আপনার প্রাইভেট ক্লাউডে মডেল চালান, ডাটা রেসিডেন্সি বজায় রাখুন, এবং আপনার প্রয়োজন অনুযায়ী পারফরম্যান্স সাজান.
কাস্টমাইজেশন: আপনার পছন্দের ওপেন টুলিং দিয়ে মডেলগুলো ফাইন-টিউন বা মানিয়ে নিন.
প্রাপ্যতা ও লাইসেন্সিং
লাইসেন্স: Apache 2.0 বাণিজ্যিক ব্যবহারসহ ব্যাপক ব্যবহার, পরিবর্তন ও পুনর্বিতরণ অনুমোদন করে (আমাদের gpt-oss ব্যবহার নীতির অধীন).
পরিবেশন: OpenAI API-র মাধ্যমে উপলভ্য নয়, তাই API মূল্য ও সীমা প্রযোজ্য নয়.
সামঞ্জস্য: vLLM, Ollama, llama.cpp-এর মতো সাধারণ ওপেন ইনফারেন্স স্ট্যাকের সঙ্গে এবং ক্লাউড বা স্ব-পরিচালিত GPU পরিবেশে চালানো যায়.
শুরু করা
মডেল ওয়েট এবং সহায়ক রিসোর্স পেতে আপনি করতে পারেন:
সংক্ষিপ্ত বিবরণ ও সরাসরি লিংকের জন্য gpt-oss ওয়েবসাইট দেখুন.
Hugging Face সংগ্রহ থেকে ওয়েট ডাউনলোড করুন — এটি একটি কমিউনিটি হাব যেখানে আপনি দুটি মডেলই খুঁজে পাবেন, ব্যবহারের উদাহরণ দেখতে পারবেন এবং চাইলে Hugging Face-এর পরিষেবার মাধ্যমে সরাসরি ইনফারেন্স চালাতে পারবেন.
রেফারেন্স ইনফারেন্স কোডের জন্য আমাদের GitHub রিপো অ্যাক্সেস করুন.
Ollama, vLLM এবং Transformers-এর মতো সমর্থিত রানটাইমে সেটআপের জন্য OpenAI Cookbook-এর গাইড ব্যবহার করুন. Cookbook-এ স্থানীয়ভাবে চালানো, সাধারণ রানটাইম ব্যবহার করা এবং—যেখানে সমর্থিত—gpt‑oss মডেল ফাইন-টিউন করার ধাপে ধাপে নির্দেশনাও রয়েছে.
gpt‑oss‑safeguard (গবেষণা প্রিভিউ)
gpt‑oss‑safeguard হলো gpt‑oss-এর ওপর তৈরি ওপেন-ওয়েট নিরাপত্তা যুক্তিবিশ্লেষণ মডেলের একটি জোড়া. এগুলো নীতিভিত্তিক নিরাপত্তা শ্রেণিবিন্যাস এবং আপনার নিয়ন্ত্রণাধীন অবকাঠামোতে চালানো সংশ্লিষ্ট ট্রাস্ট & সেফটি কাজের জন্য ডিজাইন করা. অন্যান্য gpt‑oss মডেলের মতো, এই ওয়েটগুলো OpenAI API বা ChatGPT-এর মাধ্যমে পরিবেশন করা হয় না.
রেফারেন্স স্ট্রাকচার্ড-আউটপুট স্কিমাসহ শুধু-টেক্সট মডেল (যেমন, নীতিগত রায়, যুক্তি).
নিজের নীতি আনুন: মডেল আপনার লিখিত নীতি ব্যাখ্যা করে, যাতে অল্প প্রকৌশলেই এটি বিভিন্ন পণ্যে সাধারণীকরণ করতে পারে.
যুক্তিসম্পন্ন সিদ্ধান্ত: ডিবাগিং ও অডিটে সহায়তার জন্য ঐচ্ছিক যুক্তিবিশ্লেষণ ট্রেস (ডেভেলপার ও নিরাপত্তা পেশাজীবীদের জন্য, শেষ ব্যবহারকারীদের দেখানোর জন্য নয়).
কনফিগারযোগ্য যুক্তিবিশ্লেষণ প্রচেষ্টা: লেটেন্সি বনাম গভীরতার ভারসাম্য রাখতে কম / মাঝারি / বেশি বেছে নিন.
লাইসেন্স: Apache 2.0 (নিচে প্রাপ্যতা ও লাইসেন্সিং দেখুন).
LLM-এর ইনপুট/আউটপুট ফিল্টারিং, অনলাইন কনটেন্ট লেবেলিং এবং অফলাইন ব্যাচ লেবেলিং বা পর্যালোচনা ওয়ার্কফ্লোর জন্য gpt‑oss‑safeguard উপযুক্ত. সাধারণ অ্যাপ্লিকেশনের জন্য (চ্যাট, এজেন্ট ইত্যাদি), আমরা মূল gpt‑oss মডেলগুলো সুপারিশ করি.
আপনি আপনার প্রয়োজন অনুযায়ী স্কিমা মানিয়ে নিতে পারেন. প্রম্পটিং এবং উদাহরণ সম্পর্কিত গাইডের জন্য অনুগ্রহ করে OpenAI Cookbook দেখুন.
মডেলের ভ্যারিয়েন্ট ও সাইজিং
| মডেল | উদ্দেশ্যপ্রণোদিত ব্যবহার | নোট |
|---|---|---|
| gpt‑oss‑safeguard‑120b | প্রোডাকশন, উচ্চ-ক্ষমতার সেফটি রিজনিং | 117B প্যারামিটার (≈5.1B সক্রিয়). এটি একটি মাত্র 80 GB GPU ব্যবহার করেই চলার উপযোগী করে ডিজাইন করা হয়েছে (যেমন, NVIDIA H100; AMD MI300X-এর মতো বেশি মেমরির GPU-তেও চলে). |
| gpt‑oss‑safeguard‑20b | কম লেটেন্সি / সীমাবদ্ধ পরিবেশ | 21B প্যারামিটার (≈3.6B সক্রিয়). |
দুটি মডেলই কোনো আর্কিটেকচার পরিবর্তন ছাড়া gpt‑oss থেকে ফাইন-টিউন করা হয়েছে. এগুলো gpt‑oss-এর মতো একই চ্যাট টেমপ্লেট ব্যবহার করে; আপনি আপনার বিদ্যমান সেটআপ রেখে দিতে পারেন. একটি সুপারিশকৃত প্রম্পটিং প্যাটার্ন হলো আপনার নীতি ডেভেলপার মেসেজে এবং মূল্যায়ন করার কনটেন্ট ইউজার মেসেজে রাখা.
সহায়তা ও কমিউনিটি
ওপেন-ওয়েট ডিপ্লয়মেন্টগুলো নিজে পরিচালিত ও নিজে সেবাপ্রাপ্ত. সহায়তা পাওয়ার জায়গাগুলো এখানে:
প্রশ্ন, আলোচনা, পরামর্শ: কমিউনিটির সঙ্গে যুক্ত হতে Hugging Face মডেল পেজগুলো ব্যবহার করুন.
OpenAI-এর রেফারেন্স ইনফারেন্স কোডে পুনরুত্পাদনযোগ্য বাগ: gpt-oss GitHub রিপোতে একটি ইস্যু খুলুন.
তৃতীয়-পক্ষ রানটাইমে সমস্যা (যেমন, vLLM, Ollama, llama.cpp): সংশ্লিষ্ট প্রকল্পের ইস্যু ট্র্যাকার, ফোরাম বা সহায়তা প্রক্রিয়া ব্যবহার করুন.
OpenAI কোনো স্ব-হোস্টেড বা তৃতীয়-পক্ষ-হোস্টেড ওপেন-ওয়েট সেটআপ, কনফিগারেশন, পরিবেশ বা অ্যাপ্লিকেশনের জন্য সহায়তা, হাতে-কলমে বাস্তবায়ন বা ডিবাগিং সাপোর্ট প্রদান করে না.
ROOST Model Community (RMC)-এর মাধ্যমসহ, ওপেন নিরাপত্তা টুলিং উন্নত করতে আমরা কমিউনিটির সঙ্গে ধারাবাহিকভাবে কাজ করে যাব. RMC নিরাপত্তা ওয়ার্কফ্লোতে ওপেন সোর্স AI মডেল বাস্তবায়নের সেরা অনুশীলন শেয়ার করতে নিরাপত্তা পেশাজীবী ও গবেষকদের একত্র করে, যার মধ্যে মূল্যায়নের ফলাফল ও মডেল ফিডব্যাক অন্তর্ভুক্ত. এই অংশীদারিত্ব সম্পর্কে আরও জানতে এবং কীভাবে যুক্ত হওয়া যায় তা জানতে RMC GitHub রিপো দেখুন.
সহায়তা ও কমিউনিটি
ওপেন-ওয়েট ডিপ্লয়মেন্টগুলো নিজে পরিচালিত ও নিজে সেবাপ্রাপ্ত. সহায়তা পাওয়ার জায়গাগুলো এখানে:
প্রশ্ন, আলোচনা, পরামর্শ: কমিউনিটির সঙ্গে যুক্ত হতে Hugging Face মডেল পেজগুলো ব্যবহার করুন.
OpenAI-এর রেফারেন্স ইনফারেন্স কোডে পুনরুত্পাদনযোগ্য বাগ: gpt-oss GitHub রিপোতে একটি ইস্যু খুলুন.
তৃতীয়-পক্ষ রানটাইমে সমস্যা (যেমন, vLLM, Ollama, llama.cpp): সংশ্লিষ্ট প্রকল্পের ইস্যু ট্র্যাকার, ফোরাম বা সহায়তা প্রক্রিয়া ব্যবহার করুন.
OpenAI কোনো স্ব-হোস্টেড বা তৃতীয়-পক্ষ-হোস্টেড ওপেন-ওয়েট সেটআপ, কনফিগারেশন, পরিবেশ বা অ্যাপ্লিকেশনের জন্য সহায়তা, হাতে-কলমে বাস্তবায়ন বা ডিবাগিং সাপোর্ট প্রদান করে না.
গোপনীয়তা ও নিরাপত্তা
গোপনীয়তা ও ডাটা
এই মডেলগুলো আপনার নিয়ন্ত্রণাধীন অবকাঠামোতে (অন-প্রিমাইসেস বা আপনার ক্লাউড বা হোস্টিং পার্টনারে) চালানোর জন্য ডিজাইন করা. আপনি স্পষ্টভাবে OpenAI-এর সঙ্গে শেয়ার না করলে, বা আমাদের কোনো পরিচালিত হোস্টিং পার্টনার ব্যবহার না করলে, OpenAI এই স্ব-হোস্টেড মডেলগুলোতে পাঠানো আপনার ডাটা গ্রহণ বা প্রক্রিয়া করে না.
নিরাপত্তা
এই মডেলগুলো ব্যাপক নিরাপত্তা প্রশিক্ষণ ও পরীক্ষার মধ্য দিয়ে গেছে. আরও বিস্তারিত জানতে, আমাদের মডেল কার্ড এবং প্রযুক্তিগত প্রতিবেদন দেখুন.
কনটেন্ট লঙ্ঘন রিপোর্ট করা
আপনি যদি মনে করেন gpt‑oss মডেল দিয়ে তৈরি কনটেন্ট আমাদের নীতি লঙ্ঘন করে, তাহলে আমাদের কনটেন্ট রিপোর্ট ফর্মের মাধ্যমে তা রিপোর্ট করতে পারেন. আপনার জমা দেওয়া বিষয়টি পর্যালোচনায় আমাদের টিমকে সাহায্য করতে অনুগ্রহ করে যতটা সম্ভব বিস্তারিত তথ্য দিন.
প্রায়শই জিজ্ঞাসিত প্রশ্ন
এই মডেলগুলো কি বিনামূল্যে?
gpt-oss মডেলের ওয়েট Apache 2.0 লাইসেন্স এবং gpt-oss ব্যবহার নীতি-এর অধীনে বিনামূল্যে ডাউনলোড ও ব্যবহার করা যায়. তবে এগুলো চালানোর সঙ্গে সম্পর্কিত যেকোনো খরচের দায়িত্ব আপনার — যেমন কম্পিউট, স্টোরেজ বা তৃতীয়-পক্ষ হোস্টিং ফি. এসবের মূল্য আপনার বেছে নেওয়া ইনফ্রাস্ট্রাকচার বা প্রোভাইডারের ওপর নির্ভর করবে.
এই মডেলগুলো কি “ওপেন সোর্স”?
প্রশিক্ষিত ওয়েটগুলো যে অনুমতিমূলক Apache 2.0 লাইসেন্স এবং gpt-oss ব্যবহার নীতির অধীনে সর্বসাধারণের জন্য উপলভ্য, তা বোঝাতে আমরা ওপেন মডেল বা ওপেন-ওয়েট শব্দ ব্যবহার করি. এর মানে আপনি মডেলগুলো ডাউনলোড করতে পারেন, নিজের অবকাঠামোতে বা সমর্থিত হোস্টিং ফ্রেমওয়ার্কের সঙ্গে চালাতে পারেন, এবং সেগুলো কাস্টমাইজ বা ফাইন-টিউন করতে পারেন.
ওপেন মডেল ডেভেলপার ও সংস্থাগুলোকে আরও বেশি নিয়ন্ত্রণ ও নমনীয়তা দেয়. কোথায় হোস্ট করবেন তা আপনি বেছে নিতে পারেন, নির্দিষ্ট ব্যবহারের ক্ষেত্রে মডেলগুলো মানিয়ে নিতে পারেন, এবং ব্যাপক ব্যবহার, পরিবর্তন ও পুনর্বিতরণ অনুমোদন করে এমন লাইসেন্সিং থেকে উপকৃত হতে পারেন. প্রশিক্ষিত ওয়েটগুলো ওপেন হলেও, আশপাশের কিছু অবকাঠামো বা টুলিং তাদের প্রদানকারীদের মালিকানাধীন থাকতে পারে.
আমি কি OpenAI API বা ChatGPT-এর মাধ্যমে এই মডেলগুলো অ্যাক্সেস করতে পারি?
না. এই মডেলগুলো OpenAI API-তে পরিবেশন করা হয় না এবং ChatGPT-তে দেখা যায় না.
আমি কি মডেলগুলো ফাইন-টিউন করতে পারি?
হ্যাঁ. আপনি ওপেন-সোর্স টুল ও আপনার পছন্দের অবকাঠামো ব্যবহার করে ফাইন-টিউন করতে পারেন. এই মডেলগুলোর জন্য আমরা OpenAI API-র মাধ্যমে ফাইন-টিউনিং অফার করি না.
ওপেন-ওয়েট মডেল কি API ব্যবহারের চেয়ে সস্তা?
অবকাঠামো, কাজের চাপ এবং পরিচালন পদ্ধতির ওপর ভিত্তি করে খরচ ভিন্ন হয়. কিছু ক্ষেত্রে নিজে হোস্ট করা সস্তা হতে পারে, তবে হোস্টিং, রক্ষণাবেক্ষণ ও আপগ্রেড বিবেচনায় নিলে আমাদের API প্ল্যাটফর্ম আরও কার্যকর হতে পারে.
এই মডেলগুলো কোন কোন ফিচার সমর্থন করে?
এই মডেলগুলো বর্তমানে শুধু-টেক্সট যুক্তিবিশ্লেষণ মডেল. সাধারণ রানটাইমগুলো স্ট্রিমিং, ফাংশন কলিং এবং স্ট্রাকচার্ড আউটপুটস সমর্থন করে. সুনির্দিষ্ট সক্ষমতার জন্য আপনার রানটাইমের ডকুমেন্টেশন দেখুন.
এটি ModAPI থেকে কীভাবে ভিন্ন?
এটি একটি অত্যন্ত সক্ষম যুক্তিবিশ্লেষণ মডেল, যা আপনাকে নিজের নীতি আনতে দেয়. এটি ModAPI-এর সঙ্গে একযোগে কাজ করতে পারে, তবে কম-লেটেন্সি ব্যবহারের ক্ষেত্রে সম্ভবত বিকল্প নয়.
