نؤمن بالتطوير والنشر على نحو مسؤول وتكراري كوسيلة لتحقيق الذكاء الاصطناعي العام الآمن. نجري قدرًا كبيرًا من اختبارات السلامة والمواءمة وإجراءات التخفيف قبل إطلاق أي نموذج للجمهور، كما أن لدينا أنظمة آلية وبشرية للمساعدة في اكتشاف المحتوى المسبب للمشاكل الذي يظهر في خدماتنا المقدمة للأفراد، مثل ChatGPT وGPTs. ونعرض بعضًا من تلك الجهود أدناه.

ChatGPT وImageGen

نستخدم أدوات مؤتمتة، مثل نسخة داخلية من واجهة برمجة التطبيقات ‎/moderations الخاصة بنا، لاكتشاف المحتوى (المطالبات، الإكمالات، التحميلات) الذي قد يكون ضارًا أو ينتهك سياسات الاستخدام الخاصة بنا. إذا اكتشفنا محتوى مسببًا للمشاكل، فسنقوم عادةً إما بتنبيهك إلى أن المحتوى الخاص بك قد ينتهك سياسات الاستخدام لدينا، أو بمنع النموذج من الرد على مطالبتك. قد نمنع أيضًا مشاركة الدردشة التي تحتوي على المطالبة أو الإكمال المسبب للمشاكل. في حالات محدودة للغاية، قد نحظر حسابك أيضًا بسبب سلوك فادح.

نقبل أيضًا البلاغات المقدمة من البشر عن المحتوى المسبب للمشاكل على ChatGPT. نستخدم مزيجًا من الأنظمة المؤتمتة وفريقًا مدرّبًا من الخبراء لمراجعة هذه التقارير.

ChatGPT: إذا شارك شخص ما دردشة تعتقد أنها تتضمن محتوى ينطوي على مشاكل، فيمكنك أيضًا إبلاغنا بها.

لمزيد من التفاصيل حول كيفية الإبلاغ عن المحتوى مباشرةً في ChatGPT، راجع هذه المقالة.

نماذج GPT

نستخدم أيضًا أدوات مؤتمتة مثل واجهة برمجة التطبيقات ‎/moderations الخاصة بنا لمعرفة ما إذا كان أحد نماذج GPT مسببًا للمشاكل. إذا اكتشفنا محتوى ينطوي على مشاكل مرتبطًا بأحد نماذج GPT، فسنتخذ إجراءً، مثل منع توزيع هذا النموذج. يمكن للمنشئ تعديل إعدادات GPT أو API لإزالة المحتوى المسبب للمشاكل، أو استئناف القرار عبر مسار داخل المنتج. في حالات محدودة للغاية، قد نحظر حساب المنشئ أيضًا بسبب سلوك فادح.

كما نقبل البلاغات المقدمة من البشر بشأن نماذج GPT المسببة للمشاكل. إذا رأيت أحد نماذج GPT تعتقد أنه ينتهك سياسات الاستخدام الخاصة بنا أو يتضمن محتوى مسببًا للمشاكل، يمكنك أيضًا إبلاغنا عنه. نستخدم مزيجًا من الأنظمة المؤتمتة وفريقًا مدرّبًا من الخبراء لمراجعة هذه التقارير.

كيف نحدد المحتوى المسبب للمشاكل في خدماتنا المقدمة للأفراد

ChatGPT وImageGen

نماذج GPT

هل كانت هذه المقالة مفيدة؟