تقدّم OpenAI أنظمة ذكاء اصطناعي توليدي متاحة للعامة في ولاية كاليفورنيا. نطوّر هذه الأنظمة باستخدام مجموعة متنوعة من مصادر البيانات، بما يشمل البيانات المتاحة للعامة، والبيانات التي نحصل عليها من خلال شراكات مع جهات خارجية، والمعلومات التي يقدّمها المستخدمون أو يُنتجها المدربون البشريون والباحثون. كما نستخدم بيانات اصطناعية في تطوير أنظمتنا.
نستخدم البيانات لمساعدة أنظمتنا على فهم اللغة البشرية والعالم بشكل أفضل. وهذا بدوره يتيح لأنظمتنا تعزيز الإبداع البشري، ودفع عجلة الاكتشاف العلمي والبحث الطبي، وتمكين مئات الملايين من الأشخاص من تحسين حياتهم اليومية. تُطوَّر أنظمتنا باستخدام مجموعات بيانات تحتوي على تريليونات من الرموز النصية، والصور، والصوت، والمحتوى السمعي البصري.
نستخدم مجموعة متنوعة من البيانات لتطوير أنظمتنا، بما يشمل البيانات التي قد تكون محمية بحقوق الطبع والنشر والبيانات المتاحة في الملكية العامة. وعلى الرغم من اتخاذنا خطوات لتقليل كمية المعلومات الشخصية في مجموعات بيانات التدريب، فقد تتضمن بعض البيانات معلومات شخصية ومعلومات استهلاكية مجمّعة كما هو معرّف في المادة 1798.140 من القانون المدني في كاليفورنيا. يمكن للمستخدمين إلغاء الاشتراك في استخدام محتواهم للتدريب، وكذلك طلب إزالة بعض المعلومات الشخصية من ردود ChatGPT، من خلال بوابة الخصوصية لدينا. نستخدم مجموعة متنوعة من التقنيات لمعالجة مجموعات البيانات لدينا بهدف تحسين أداء نموذجنا ودقتها.
بدأنا جمع البيانات لتطوير أنظمتنا تقريبًا في عام 2018، وما زلنا نواصل جمع البيانات حتى اليوم. وقد بدأنا استخدام مجموعات البيانات لأول مرة في تطوير الأنظمة في عام 2021.
يمكن العثور على مزيد من المعلومات حول تطوير أنظمتنا في بطاقات الأنظمة لدينا.
ملخص بيانات التدريب وفقًا للمادة 3111 من القانون المدني في ولاية كاليفورنيا
تم التحديث: 17 hours ago
