Güvenli genel yapay zekaya ulaşmanın bir yolu olarak sorumlu, yinelemeli geliştirme ve dağıtıma inanıyoruz. Bir modeli kamuya sunmadan önce önemli ölçüde güvenlik ve uyum testi ve azaltımı yapıyoruz; ayrıca ChatGPT ve GPT'ler gibi bireylere yönelik hizmetlerimizde görünen sorunlu içeriği tespit etmeye yardımcı olan otomatik ve insan sistemlerimiz de bulunuyor. Bu çalışmaların bazılarını aşağıda özetliyoruz.
ChatGPT, ImageGen ve SORA
Zararlı olabilecek veya Kullanım Politikalarımızı ihlal edebilecek içeriği (komutlar, tamamlamalar, yüklemeler) tespit etmek için /moderations API'mizin dahili bir sürümü gibi otomatik araçlar kullanıyoruz. Sorunlu içerik tespit edersek, genellikle ya içeriğinizin kullanım politikalarımızı ihlal edebileceği konusunda sizi uyarırız ya da modelin komutunuza yanıt vermesini engelleriz. Sorunlu komutu veya tamamlamayı içeren sohbetin paylaşılmasını da engelleyebiliriz. Çok sınırlı bazı durumlarda, ağır ihlaller içeren davranışlar nedeniyle hesabınızı da yasaklayabiliriz.
ChatGPT ve SORA'daki sorunlu içeriklere ilişkin insan bildirimlerini de kabul ediyoruz. Bu bildirimleri incelemek için otomatik sistemler ile eğitimli uzmanlardan oluşan bir ekibin birleşimini kullanıyoruz.
ChatGPT: Sorunlu içerik içerdiğini düşündüğünüz bir sohbet birisi tarafından paylaşılırsa, bunu bize bildirebilirsiniz.
SORA: Akışınızda sorunlu içerik içerdiğini düşündüğünüz bir video veya görsel görürseniz, bunu bize bildirebilirsiniz.
İçeriği doğrudan ChatGPT veya SORA içinde nasıl bildireceğinize dair daha fazla ayrıntı için bu makaleye bakın.
GPT'ler
Bir GPT'nin potansiyel olarak sorunlu olup olmadığını görmek için /moderation API'miz gibi otomatik araçlar da kullanıyoruz. GPT ile ilişkili sorunlu içerik tespit edersek, dağıtılmasını engellemek gibi önlemler alırız. Oluşturucu, sorunlu içeriği kaldırmak için GPT'nin veya API'nin yapılandırmasını düzenleyebilir ya da ürün içi bir akış üzerinden karara itiraz edebilir. Çok sınırlı bazı durumlarda, ağır ihlaller içeren davranışlar nedeniyle oluşturucunun hesabını da yasaklayabiliriz.
Sorunlu GPT'lere ilişkin insan bildirimlerini de kabul ediyoruz. Kullanım politikalarımızı ihlal ettiğini düşündüğünüz veya başka şekilde sorunlu içerik yansıtan bir GPT görürseniz, bunu da bize bildirebilirsiniz. Bu bildirimleri incelemek için otomatik sistemler ile eğitimli uzmanlardan oluşan bir ekibin birleşimini kullanıyoruz.
