OpenAI
Bu sayfanın çevirisi otomatik olarak yapılmıştır. Orijinal İngilizce makaleyi görüntüleyin.

ChatGPT ve temel modellerimiz nasıl geliştiriliyor

Modellerimizi nasıl geliştirdiğimizi ve ChatGPT gibi ürünlerde nasıl kullandığımızı öğrenin

Güncellenme zamanı: 2 hours ago

Not: Belirli hizmetler için veri saklama, son hukuki gelişmelerden etkilenebilir; daha fazla ayrıntı için lütfen blog yazımıza bakın.

OpenAI’nin ChatGPT’ye güç veren modeller dahil olmak üzere temel modelleri, üç ana bilgi kaynağı kullanılarak geliştirilir: (1) internette herkese açık olan bilgiler, (2) erişmek için üçüncü taraflarla iş ortaklığı yaptığımız bilgiler ve (3) kullanıcılarımızın, insan eğitmenlerimizin ve araştırmacılarımızın sağladığı veya oluşturduğu bilgiler.

Bu makale, bu modelleri geliştirmeye yardımcı olmak için kullandığımız herkese açık bilgilere ve bu bilgileri gizlilik yasalarına uygun şekilde nasıl topladığımıza ve kullandığımıza genel bir bakış sunar. ChatGPT konuşmalarının modellerimizi eğitmeye yardımcı olmak için kullanılmasından nasıl vazgeçileceği dahil olmak üzere, hizmetlerimizin kullanıcılarından bilgileri nasıl topladığımızı ve kullandığımızı anlamak için lütfen Gizlilik Politikamıza ve bu yardım merkezi makalesine bakın.

ChatGPT nedir ve nasıl çalışır?

ChatGPT, internet üzerinden erişebileceğiniz yapay zekâ tabanlı bir hizmettir. ChatGPT’yi bilgileri düzenleme ve özetleme, çevirilere yardımcı olma, görüntüleri analiz etme veya oluşturma, yaratıcılığa ve fikirlere ilham verme ve diğer günlük etkinlikler dahil olmak üzere çok çeşitli görevler için kullanabilirsiniz. ChatGPT; metin, görüntü, ses ve video dahil olmak üzere büyük miktarda bilgiden kalıpları öğrenerek kullanıcı sorularını ve talimatlarını anlayıp yanıtlamak üzere tasarlanmıştır. Eğitim sırasında model, sözcüklerin bağlam içinde genellikle nasıl birlikte göründüğü gibi bu veriler içindeki ilişkileri analiz eder ve bu anlayışı, yanıt oluştururken bir seferde bir sözcük olacak şekilde bir sonraki en olası sözcüğü tahmin etmek için kullanır. Benzer şekilde, görüntü gibi başka içerik biçimleri üreten modeller de piksellerin birbirleriyle ve eğitim verilerindeki ilişkili açıklamalarla nasıl bağlantılı olduğuna dair kalıpları öğrenir.

Örneğin, modelin öğrenme süreci sırasında (“eğitim” olarak bilinir) modelden şu tür bir cümleyi tamamlaması istenebilir: “Sola dönmek yerine, ___ döndü.” Eğitimin başlarında yanıtları büyük ölçüde rastgeledir. Ancak model büyük hacimde metni işleyip ondan öğrendikçe, kalıpları tanımada ve bir sonraki en olası sözcüğü tahmin etmede daha iyi hale gelir. Bu süreç, anlayışını geliştirmek ve doğruluğunu artırmak için milyonlarca cümle üzerinde tekrarlanır.

Bir cümleyi tamamlamanın birden fazla makul yolu olduğu için—örneğin “Sola dönmek yerine sağa döndü”, “arkasına döndü” veya “geri döndü”—modelin nasıl yanıt verdiğinde doğası gereği bir rastgelelik unsuru vardır. Sonuç olarak, aynı soru farklı sorgularda farklı yanıtlar üretebilir.

Makine öğrenimi modelleri, “ağırlıklar” veya “parametreler” olarak bilinen büyük sayı kümelerinden ve bu sayıları yorumlayıp kullanan koddan oluşur. Bu modeller, üzerinde eğitildikleri verilerin kopyalarını saklamaz veya tutmaz. Bunun yerine, bir model öğrendikçe, parametrelerinin değerleri belirlediği kalıpları yansıtacak şekilde biraz ayarlanır. Önceki örnekte model, eğitim cümlelerini saklayarak değil, iç parametrelerini güncelleyerek rastgele sözcükler tahmin etmekten daha doğru tahminler yapmaya geçti. Model, eğitim sırasında işlediği cümlelerin, görüntülerin veya seslerin kopyalarını tutmaz. ChatGPT, eğitim verilerinden “kopyalayıp yapıştırmaz”; bu, kapsamlı bir çalışmadan sonra bir öğretmenin, özgün materyalleri ezberlemeden veya kelimesi kelimesine yeniden üretmeden fikirler arasındaki ilişkileri anlayarak kavramları açıklayabilmesine benzer. Model, bir kullanıcı isteğine yanıt oluştururken yeni içerik tahmin etmek ve oluşturmak için bu öğrenilmiş ağırlıkları kullanır.

ChatGPT’yi eğitmek için ne tür herkese açık bilgiler kullanılır?

Herkese açık internet içeriği için yalnızca internette ücretsiz ve açık şekilde erişilebilen bilgileri kullanırız. Ödeme duvarlarının arkasında olduğu bilinen kaynaklardan veya karanlık web’den kasıtlı olarak veri toplamayız. Ayrıca modellerimizin öğrenmesini istemediğimiz nefret söylemi, yetişkinlere yönelik içerik, kişisel bilgileri toplayıp bir araya getiren siteler ve spam gibi materyalleri kaldırmak için filtreler uygularız. Kalan bilgiler daha sonra modellerimizi eğitmek için kullanılır.

ChatGPT’yi eğitmek için kişisel bilgiler kullanılır mı?

Çevrimiçi içeriğin önemli bir bölümü insanlar hakkındaki bilgileri içerir, bu nedenle eğitim verilerimiz tesadüfen kişisel bilgiler içerebilir. Ancak modellerimizi eğitmek amacıyla kasıtlı olarak kişisel bilgi toplamayız.

Eğitim verilerini, kullanıcı profilleri oluşturmak, bireylerle iletişime geçmek veya reklam ya da pazarlama çalışmalarımızın bir parçası olarak kullanmak için değil; modelin tahmin, akıl yürütme ve problem çözme gibi kabiliyetlerini geliştirmek için kullanırız.

Bazı durumlarda modeller; adlar ve adresler gibi öğelerin dilde nasıl işlev gördüğünü anlamak veya kamuya mal olmuş kişileri ve iyi bilinen varlıkları tanımak için kişisel bilgilerden öğrenebilir. Bu, modelin daha doğru ve bağlama daha uygun yanıtlar üretmesine yardımcı olur.

Eğitim sırasında kişisel bilgilerin işlenmesini sınırlamak için aktif adımlar atarız. Örneğin, büyük miktarda kişisel veriyi toplayıp bir araya getiren kaynakları hariç tutar ve modellerimizi bireyler hakkındaki özel veya hassas bilgilere yönelik isteklere yanıt vermekten kaçınacak şekilde eğitiriz.

ChatGPT’nin geliştirilmesi gizlilik yasalarına nasıl uygundur?

Eğitim bilgilerini hukuka uygun şekilde kullanırız. Temel modellerimiz, içerik oluşturma ve müşteri desteğinden yazılım geliştirmeye, kişiselleştirilmiş eğitime ve bilimsel araştırmaya kadar çok çeşitli faydalı uygulamalara güç verir. Bu kabiliyetler büyük ölçekli eğitim verilerine dayanır. Modellerimizi eğitmek için kullanılan bilgiler herkese açıktır ve bireylere zarar verme amacı taşımaz. Eğitim bilgilerinde yer alan kişisel bilgileri toplamamızı ve kullanmamızı, Gizlilik Politikamızda daha ayrıntılı olarak açıklandığı üzere GDPR gibi gizlilik yasaları kapsamındaki meşru menfaatlere dayandırırız. Bu bilgileri yasal ve sorumlu bir şekilde topladığımızdan ve kullandığımızdan emin olmaya yardımcı olmak için bir veri koruma etki değerlendirmesi tamamladık.


İtiraz taleplerine ve benzer haklara yanıt veririz. Dil öğreniminin bir sonucu olarak ChatGPT yanıtları, kişisel bilgileri herkese açık internette birden çok kez görünen bireyler (örneğin, kamuya mal olmuş kişiler) hakkında bazen kişisel bilgiler içerebilir. Belirli yargı bölgelerindeki bireyler, kişisel bilgilerinin modellerimiz tarafından işlenmesine itiraz edebilir veya Gizlilik Portalımız üzerinden diğer veri sahibi hak taleplerinde bulunabilir. Bu hakları dsar@openai.com adresine ulaşarak da kullanabilirsiniz.

Gizlilik yasalarına uygun olarak bazı hakların mutlak olmayabileceğini lütfen unutmayın. Bunu yapmak için hukuki bir gerekçemiz varsa bir talebi reddedebiliriz. Bununla birlikte, kişisel bilgilerin korunmasına öncelik vermeye çalışır ve yürürlükteki tüm gizlilik yasalarına uyarız. Bir konuyu yeterince ele almadığımızı düşünüyorsanız, yerel denetim makamınıza şikâyette bulunma hakkına sahipsiniz.


Web sitemizi, uygulamalarımızı ve hizmetlerimizi kullandığınızda sizden veya sizin hakkınızda topladığımız kişisel bilgilere ilişkin OpenAI uygulamaları hakkında daha fazla bilgi için lütfen Gizlilik Politikamıza bakın.

Bu makale yararlı oldu mu?