OpenAI
Bu sayfanın çevirisi otomatik olarak yapılmıştır. Orijinal İngilizce makaleyi görüntüleyin.

ChatGPT ve temel modellerimiz nasıl geliştiriliyor

Modellerimizi nasıl geliştirdiğimizi ve ChatGPT gibi ürünlerde nasıl kullandığımızı öğrenin

Güncellenme zamanı: 3 days ago
Not
: Belirli hizmetler için veri saklama süreleri son hukuki gelişmelerden etkilenebilir; ayrıntılar için lütfen

blog yazımıza
bakın.

OpenAI’ın ChatGPT’yi çalıştıran modeller de dahil olmak üzere temel modelleri, üç birincil bilgi kaynağı kullanılarak geliştirilir: (1) internette kamuya açık olarak bulunan bilgiler, (2) üçüncü taraflarla iş ortaklığı yaparak eriştiğimiz bilgiler ve (3) kullanıcılarımızın, insan eğitmenlerin ve araştırmacıların sağladığı veya oluşturduğu bilgiler.

Bu makale, bu modellerin geliştirilmesine yardımcı olmak için kullandığımız kamuya açık bilgilere ve bu bilgileri gizlilik yasalarına uygun şekilde nasıl topladığımıza ve kullandığımıza genel bir bakış sunar. Modellerimizi eğitmeye yardımcı olmak için ChatGPT konuşmalarının kullanılmasını devre dışı bırakma dahil olmak üzere, hizmetlerimizin kullanıcılarından bilgileri nasıl topladığımızı ve kullandığımızı anlamak için lütfen Gizlilik Politikamıza ve bu yardım merkezi makalesine bakın.

ChatGPT nedir ve nasıl çalışır?

ChatGPT, internet üzerinden erişebileceğiniz yapay zekâ tabanlı bir hizmettir. ChatGPT’yi bilgileri düzenleme ve özetleme, çevirilere yardımcı olma, görüntüleri analiz etme veya oluşturma, yaratıcılığı ve fikirleri teşvik etme ve diğer günlük etkinlikler dahil olmak üzere çok çeşitli görevler için kullanabilirsiniz. ChatGPT; metin, görüntü, ses ve video dahil olmak üzere büyük miktarda bilgiden kalıplar öğrenerek kullanıcı sorularını ve talimatlarını anlamak ve bunlara yanıt vermek üzere tasarlanmıştır. Eğitim sırasında model, bu veriler içindeki ilişkileri (örneğin kelimelerin bağlam içinde genellikle nasıl birlikte göründüğünü) analiz eder ve bir yanıt oluştururken her seferinde bir kelime olacak şekilde bir sonraki en olası kelimeyi tahmin etmek için bu anlayışı kullanır. Benzer şekilde, görüntüler gibi başka içerik biçimleri oluşturan modeller, eğitim verilerinde piksellerin birbirleriyle ve ilişkili açıklama metinleriyle nasıl bağlantılı olduğuna dair kalıpları öğrenir.

Örneğin, modelin öğrenme süreci sırasında (“eğitim” olarak bilinir), modelden şu gibi bir cümleyi tamamlaması istenebilir: “Sola dönmek yerine, ___ döndü.” Eğitimin başlarında yanıtları büyük ölçüde rastgeledir. Ancak model büyük miktarda metni işleyip ondan öğrendikçe, kalıpları tanıma ve bir sonraki en olası kelimeyi tahmin etme konusunda daha iyi hale gelir. Bu süreç, modelin anlayışını geliştirmek ve doğruluğunu artırmak için milyonlarca cümle üzerinde tekrarlanır.

Bir cümleyi tamamlamanın “Sola dönmek yerine sağa döndü”, “etrafında döndü” veya “geri döndü” gibi birden fazla makul yolu olduğundan, modelin nasıl yanıt verdiğinde doğal bir rastgelelik unsuru vardır. Sonuç olarak, aynı soru farklı sorgularda farklı yanıtlar üretebilir.

Makine öğrenimi modelleri, “ağırlıklar” veya “parametreler” olarak bilinen büyük sayı kümelerinden ve bu sayıları yorumlayıp kullanan koddan oluşur. Bu modeller, üzerinde eğitildikleri verilerin kopyalarını saklamaz veya muhafaza etmez. Bunun yerine, bir model öğrendikçe, parametrelerinin değerleri belirlediği kalıpları yansıtacak şekilde biraz ayarlanır. Önceki örnekte model, eğitim cümlelerini saklayarak değil, dahili parametrelerini güncelleyerek rastgele kelimeler tahmin etmekten daha doğru tahminler yapmaya doğru gelişti. Model, eğitim sırasında işlediği cümlelerin, görüntülerin veya seslerin kopyalarını muhafaza etmez. ChatGPT, eğitim verilerinden “kopyala ve yapıştır” yapmaz; bu, kapsamlı bir çalışmanın ardından bir öğretmenin, özgün materyalleri ezberlemeden veya kelimesi kelimesine yeniden üretmeden fikirler arasındaki ilişkileri anlayarak kavramları açıklayabilmesine benzer. Model, bir kullanıcı isteğine yanıt oluştururken yeni içerik tahmin etmek ve oluşturmak için öğrenilen bu ağırlıkları kullanır.

ChatGPT’yi eğitmek için ne tür kamuya açık bilgiler kullanılır?

Kamuya açık internet içeriği için yalnızca internette ücretsiz ve açık şekilde erişilebilen bilgileri kullanırız. Ödeme duvarlarının arkasında olduğu bilinen kaynaklardan veya dark web’den kasıtlı olarak veri toplamayız. Ayrıca modellerimizin öğrenmesini istemediğimiz nefret söylemi, yetişkinlere yönelik içerik, kişisel bilgileri toplayıp bir araya getiren siteler ve spam gibi materyalleri kaldırmak için filtreler uygularız. Kalan bilgiler daha sonra modellerimizi eğitmek için kullanılır.

ChatGPT’yi eğitmek için kişisel bilgiler kullanılıyor mu?

Çevrimiçi içeriğin önemli bir bölümü insanlar hakkındaki bilgileri içerir; bu nedenle eğitim verilerimiz tesadüfen kişisel bilgiler içerebilir. Ancak modellerimizi eğitmek amacıyla kasıtlı olarak kişisel bilgi toplamayız.

Eğitim verilerini, kullanıcı profilleri oluşturmak, kişilerle iletişime geçmek veya reklam ya da pazarlama çalışmalarımızın bir parçası olarak kullanmak için değil; modelin tahmin, akıl yürütme ve problem çözme gibi yeteneklerini geliştirmek için kullanırız.

Bazı durumlarda modeller, adlar ve adresler gibi öğelerin dilde nasıl işlediğini anlamak veya tanınmış kişileri ve bilinen kuruluşları tanımak için kişisel bilgilerden öğrenebilir. Bu, modelin daha doğru ve bağlama uygun yanıtlar oluşturmasına yardımcı olur.

Eğitim sırasında kişisel bilgilerin işlenmesini sınırlamak için aktif adımlar atarız. Örneğin, büyük miktarda kişisel veriyi toplayıp bir araya getiren kaynakları hariç tutarız ve modellerimizi bireyler hakkındaki özel veya hassas bilgilere yönelik taleplere yanıt vermekten kaçınacak şekilde eğitiriz.

ChatGPT’nin geliştirilmesi gizlilik yasalarına nasıl uyar?

Eğitim bilgilerini hukuka uygun şekilde kullanırız. Temel modellerimiz, içerik oluşturma ve müşteri desteğinden yazılım geliştirmeye, kişiselleştirilmiş eğitime ve bilimsel araştırmaya kadar çok çeşitli faydalı uygulamalara güç sağlar. Bu yetenekler büyük ölçekli eğitim verilerine bağlıdır. Modellerimizi eğitmek için kullanılan bilgiler kamuya açıktır ve bireylere zarar vermeyi amaçlamaz. Eğitim bilgileri içinde yer alan kişisel bilgileri toplamamızı ve kullanmamızı, Gizlilik Politikamızda daha ayrıntılı açıklandığı üzere GDPR gibi gizlilik yasaları kapsamındaki meşru menfaatlere dayandırırız. Bu bilgileri yasal ve sorumlu bir şekilde topladığımızdan ve kullandığımızdan emin olmaya yardımcı olmak için bir veri koruma etki değerlendirmesi tamamladık.

İtiraz taleplerine ve benzer haklara yanıt veririz. Dil öğrenmenin bir sonucu olarak, ChatGPT yanıtları bazen kişisel bilgileri herkese açık internette birden çok kez görünen kişiler (örneğin kamuya mal olmuş kişiler) hakkında kişisel bilgiler içerebilir. Belirli yargı bölgelerindeki bireyler, kişisel bilgilerinin modellerimiz tarafından işlenmesine itiraz edebilir veya Gizlilik Portalımız üzerinden veri sahibi haklarına ilişkin başka taleplerde bulunabilir. Bu hakları dsar@openai.com adresine ulaşarak da kullanabilirsiniz.

Lütfen gizlilik yasaları uyarınca bazı hakların mutlak olmayabileceğini unutmayın. Bunu yapmak için hukuka uygun bir nedenimiz varsa bir talebi reddedebiliriz. Ancak kişisel bilgilerin korunmasına öncelik vermeye çalışır ve geçerli tüm gizlilik yasalarına uyarız. Bir sorunu yeterince ele almadığımızı düşünüyorsanız, yerel denetim makamınıza şikâyette bulunma hakkınız vardır.

Web sitemizi, uygulamalarımızı ve hizmetlerimizi kullandığınızda sizden veya sizin hakkınızda topladığımız kişisel bilgilere ilişkin OpenAI uygulamaları hakkında daha fazla bilgi için lütfen Gizlilik Politikamıza bakın.

Bu makale yararlı oldu mu?