OpenAI
এই পেজটি মেশিন দিয়ে অনুবাদ করা হয়েছে। মূল ইংরেজি আর্টিকেল দেখুন

ক্যালিফোর্নিয়া সিভিল কোড সেকশন 3111 অনুযায়ী প্রশিক্ষণ ডেটার সারসংক্ষেপ

আপডেট করা হয়েছে: 18 hours ago

OpenAI ক্যালিফোর্নিয়া অঙ্গরাজ্যে সর্বসাধারণের জন্য উপলভ্য জেনারেটিভ AI সিস্টেম সরবরাহ করে. আমরা বিভিন্ন ধরনের ডেটা উৎস ব্যবহার করে এই সিস্টেমগুলো তৈরি করি, যার মধ্যে রয়েছে সর্বসাধারণের জন্য উপলভ্য ডেটা, তৃতীয় পক্ষের সঙ্গে অংশীদারত্বের মাধ্যমে আমরা যে ডেটায় প্রবেশাধিকার পাই, এবং আমাদের ব্যবহারকারী বা মানব প্রশিক্ষক ও গবেষকেরা যে তথ্য প্রদান বা তৈরি করেন. আমরা সিনথেটিক ডেটা ব্যবহার করেও আমাদের সিস্টেমগুলো তৈরি করি.

আমাদের সিস্টেমগুলো যাতে মানুষের ভাষা ও বিশ্বকে আরও ভালোভাবে বুঝতে পারে, সে জন্য আমরা ডেটা ব্যবহার করি. এর ফলে আমাদের সিস্টেমগুলো মানব সৃজনশীলতা বাড়াতে, বৈজ্ঞানিক আবিষ্কার ও চিকিৎসা গবেষণাকে এগিয়ে নিতে এবং কোটি কোটি মানুষকে তাদের দৈনন্দিন জীবন উন্নত করতে সক্ষম করে. আমাদের সিস্টেমগুলো এমন ডেটাসেটের ওপর তৈরি, যাতে টেক্সট, ছবি, অডিও এবং অডিওভিজ্যুয়াল কনটেন্টের ট্রিলিয়ন ট্রিলিয়ন টোকেন রয়েছে.

আমাদের সিস্টেম তৈরি করতে আমরা বৈচিত্র্যময় ডেটা ব্যবহার করি, যার মধ্যে কপিরাইট দ্বারা সুরক্ষিত হতে পারে এমন ডেটা এবং পাবলিক ডোমেইনের ডেটা অন্তর্ভুক্ত. আমাদের প্রশিক্ষণ ডেটাসেটে ব্যক্তিগত তথ্যের পরিমাণ কমাতে আমরা পদক্ষেপ নিলেও, আমাদের কিছু ডেটায় ব্যক্তিগত তথ্য এবং ক্যালিফোর্নিয়া সিভিল কোডের ধারা 1798.140-এ সংজ্ঞায়িত সমষ্টিগত ভোক্তা তথ্য থাকতে পারে. আমাদের প্রাইভেসি পোর্টাল ব্যবহার করে আমাদের ব্যবহারকারীরা তাদের কনটেন্ট প্রশিক্ষণে ব্যবহারের বাইরে রাখার বিকল্প বেছে নিতে পারেন, পাশাপাশি ChatGPT-এর উত্তর থেকে নির্দিষ্ট ব্যক্তিগত তথ্য অপসারণের অনুরোধও করতে পারেন. আমাদের মডেলগুলোর কার্যক্ষমতা ও নির্ভুলতা উন্নত করতে আমরা আমাদের ডেটাসেট প্রক্রিয়াকরণের জন্য বিভিন্ন কৌশল ব্যবহার করি.

আমরা আনুমানিক 2018 সালে আমাদের সিস্টেম তৈরি করার জন্য ডেটা সংগ্রহ শুরু করি, এবং আজও ডেটা সংগ্রহ অব্যাহত রেখেছি. আমরা প্রথম 2021 সালে সিস্টেম তৈরির জন্য আমাদের ডেটাসেট ব্যবহার করি.

আমাদের সিস্টেমগুলোর উন্নয়ন সম্পর্কে অতিরিক্ত তথ্য আমাদের সিস্টেম কার্ডগুলোতে পাওয়া যাবে.

এই নিবন্ধটি কি সহায়ক ছিল?