OpenAI ক্যালিফোর্নিয়া অঙ্গরাজ্যে সর্বসাধারণের জন্য উপলভ্য জেনারেটিভ AI সিস্টেম সরবরাহ করে. আমরা বিভিন্ন ধরনের ডেটা উৎস ব্যবহার করে এই সিস্টেমগুলো তৈরি করি, যার মধ্যে রয়েছে সর্বসাধারণের জন্য উপলভ্য ডেটা, তৃতীয় পক্ষের সঙ্গে অংশীদারত্বের মাধ্যমে আমরা যে ডেটায় প্রবেশাধিকার পাই, এবং আমাদের ব্যবহারকারী বা মানব প্রশিক্ষক ও গবেষকেরা যে তথ্য প্রদান বা তৈরি করেন. আমরা সিনথেটিক ডেটা ব্যবহার করেও আমাদের সিস্টেমগুলো তৈরি করি.
আমাদের সিস্টেমগুলো যাতে মানুষের ভাষা ও বিশ্বকে আরও ভালোভাবে বুঝতে পারে, সে জন্য আমরা ডেটা ব্যবহার করি. এর ফলে আমাদের সিস্টেমগুলো মানব সৃজনশীলতা বাড়াতে, বৈজ্ঞানিক আবিষ্কার ও চিকিৎসা গবেষণাকে এগিয়ে নিতে এবং কোটি কোটি মানুষকে তাদের দৈনন্দিন জীবন উন্নত করতে সক্ষম করে. আমাদের সিস্টেমগুলো এমন ডেটাসেটের ওপর তৈরি, যাতে টেক্সট, ছবি, অডিও এবং অডিওভিজ্যুয়াল কনটেন্টের ট্রিলিয়ন ট্রিলিয়ন টোকেন রয়েছে.
আমাদের সিস্টেম তৈরি করতে আমরা বৈচিত্র্যময় ডেটা ব্যবহার করি, যার মধ্যে কপিরাইট দ্বারা সুরক্ষিত হতে পারে এমন ডেটা এবং পাবলিক ডোমেইনের ডেটা অন্তর্ভুক্ত. আমাদের প্রশিক্ষণ ডেটাসেটে ব্যক্তিগত তথ্যের পরিমাণ কমাতে আমরা পদক্ষেপ নিলেও, আমাদের কিছু ডেটায় ব্যক্তিগত তথ্য এবং ক্যালিফোর্নিয়া সিভিল কোডের ধারা 1798.140-এ সংজ্ঞায়িত সমষ্টিগত ভোক্তা তথ্য থাকতে পারে. আমাদের প্রাইভেসি পোর্টাল ব্যবহার করে আমাদের ব্যবহারকারীরা তাদের কনটেন্ট প্রশিক্ষণে ব্যবহারের বাইরে রাখার বিকল্প বেছে নিতে পারেন, পাশাপাশি ChatGPT-এর উত্তর থেকে নির্দিষ্ট ব্যক্তিগত তথ্য অপসারণের অনুরোধও করতে পারেন. আমাদের মডেলগুলোর কার্যক্ষমতা ও নির্ভুলতা উন্নত করতে আমরা আমাদের ডেটাসেট প্রক্রিয়াকরণের জন্য বিভিন্ন কৌশল ব্যবহার করি.
আমরা আনুমানিক 2018 সালে আমাদের সিস্টেম তৈরি করার জন্য ডেটা সংগ্রহ শুরু করি, এবং আজও ডেটা সংগ্রহ অব্যাহত রেখেছি. আমরা প্রথম 2021 সালে সিস্টেম তৈরির জন্য আমাদের ডেটাসেট ব্যবহার করি.
আমাদের সিস্টেমগুলোর উন্নয়ন সম্পর্কে অতিরিক্ত তথ্য আমাদের সিস্টেম কার্ডগুলোতে পাওয়া যাবে.
ক্যালিফোর্নিয়া সিভিল কোড সেকশন 3111 অনুযায়ী প্রশিক্ষণ ডেটার সারসংক্ষেপ
আপডেট করা হয়েছে: 18 hours ago
