OpenAI
Bu sayfanın çevirisi otomatik olarak yapılmıştır. Orijinal İngilizce makaleyi görüntüleyin.

ChatGPT Enterprise'ta Dosya Yüklemelerini Optimize Etme

ChatGPT Enterprise özelliklerinin dosya türü, sayısı ve boyutuna göre dosyaları nasıl işlediğini anlayın. Dosya gereksinimlerine göre çıktıları iyileştirin.

Güncellenme zamanı: 13 days ago

ChatGPT Enterprise artık komutlara dahil edilen PDF dosyalarına gömülü görselleri (resimler, grafikler, diyagramlar vb.) okumayı ve anlamayı destekler. Kullanıcılar bir PDF yükleyebilir ve ChatGPT bu dosyadaki metni ve tüm görsel öğeleri yorumlayabilir.

Ayrıntılar için bkz. PDF’lerle Görsel Getirme SSS.

ChatGPT Enterprise dosyaları birkaç şekilde yüklemenize olanak tanır:

Bu kılavuz, ChatGPT Enterprise özelliklerinin dosyaları türlerine, sayılarına ve boyutlarına göre nasıl işlediğini açıklar ve dosya gereksinimlerine göre çıktıları iyileştirme stratejilerini ele alır.

Özet

ChatGPT Enterprise farklı dosya türlerini çok farklı biçimde ele alır: PDF’ler, Sunumlar ve Word dosyaları gibi metin belgelerinden metin çıkarır; elektronik tablolardaki yapılandırılmış verileri Python kodu kullanarak analiz eder; görüntü dosyalarını ise GPT-Vision aracılığıyla açıklar. Hangi dosya türünün hangi iş akışını tetiklediğini anlamak, beklenen sonucu almak için çok önemlidir.

Metin tabanlı belgelerde ChatGPT Enterprise, komutun yanına doğrudan mümkün olduğunca çok ilgili metin ekler ve ek bilgilere erişmek için bir arama sistemi kullanır. Bu, belirli soruları yanıtlamak için iyi çalışır. Ancak bu yaklaşım, çok büyük belgeleri özetleme veya birden çok büyük dosyayı karşılaştırma gibi karmaşık görevlerde zorlanabilir. Sonuçlarınızı iyileştirmeye yönelik stratejileri anlamak için okumaya devam edin.

Dosyaları türe göre işleme

ChatGPT Enterprise dosyaları üç ana şekilde işler: metin çıkarma, kod analizi ve görüntü yorumlama. ChatGPT Enterprise’ın hangi iş akışını izleyeceğini dosya türü belirler.

Metin Tabanlı GetirmeKod Çalıştırma AracıGörüntü İşlemeGörsel Getirme
Dosya Türü Örnekleripptx, docx, txt, md, json, xml, pdf*
*

GPT Knowledge
veya

Proje Dosyaları
olarak yüklenen PDF’ler
csv, xls, xlsx*
*Not: Kod Çalıştırma Aracı her dosya türü üzerinde çalışabilir, ancak ChatGPT Enterprise elektronik tablolar için en yaygın olarak varsayılan biçimde CI kullanır
jpg, pngpdf*
* Kullanıcı komutlarına dahil edilen PDF’ler
DavranışDosyadan metni çıkarır; metnin bir kısmı doğrudan bağlam kapasitesine yapıştırılır (“doldurulur”), bir kısmı ise arama için depolanırKod Çalıştırma Aracı, dosyayı işlenmek üzere Python’a aktarırGörüntüler,

bilinen sınırlamalara
tabi olarak çok modlu modeller tarafından yerel olarak yorumlanır.
Metin getirme ve görüntü işlemenin hibriti. Metin dijital olarak çıkarılır ve görsel içerik çok modlu modeller tarafından yerel olarak yorumlanır.

Yalnızca metin içeren dosyalar, görüntü dosyaları veya açıkça yapılandırılmış veri dosyaları (ör. işlemlerden oluşan bir Excel tablosu) için bu ayrımlar mümkün olan en iyi davranışı temsil eder.

Daha az belirgin bazı gri alanlar vardır, örneğin:

  • PDF dışındaki dosyalara gömülü görüntüler işlenmez. Bunları dahil etmek için yüklemeden önce dosyayı PDF’ye dönüştürün.

  • ChatGPT Enterprise, belge büyük miktarda metin içerse bile elektronik tablolarla etkileşim kurmak için her zaman Kod Çalıştırma Aracı’nı kullanır. Örneğin ChatGPT Enterprise’dan 10 satır metin içeren bir CSV dosyasını çevirmesini isterseniz, dosyayı bir Python kitaplığı kullanarak çevirmeye çalışır; bu, modelin doğrudan çeviri üretmesine izin vermekten daha az doğrudur. Bunu azaltmak için elektronik tabloyu metin tabanlı bir biçime (örneğin PDF’ye) dışa aktarmayı deneyin.

  • Benzer şekilde, JSON dosyasında yer alan yapılandırılmış bir işlem tablosu yüklerseniz ChatGPT Enterprise bu dosyayı düz metin olarak yorumlar. Bir JSON dosyasındaki verileri analiz etmek istiyorsanız, komutunuzda modele Kod Çalıştırma Aracı’nı kullanmasını söyleyin.

Dosyaları boyuta göre işleme

ChatGPT Enterprise, en fazla 128 bin tokenlık bağlam kapasitesine sahip modeller kullanır (yaklaşık 200 sayfa metin). Ancak yüklenen dosyalardaki metni dahil etmek için tokenların tamamı kullanılmaz. “Doldurulan” token sayısı kullanım türüne göre değişir.

ChatGPT Enterprise metnin bir kısmını “doldurur”; kalan metin ise özel bir arama dizinine (“vektör deposu”; büyük miktarda metni verimli biçimde depolamak ve almak için tasarlanmış bir veritabanı türü) gönderilir. Bir soru sorduğunuzda ChatGPT Enterprise, özel arama dizininden alınan ilgili parçalarla birlikte dahil edilmiş metni de getirir.

Tek bir belge yüklerseniz ChatGPT Enterprise, sınıra ulaşana kadar başlangıçtan itibaren metni dahil eder. Birden çok belge yüklerseniz ChatGPT Enterprise, her belgenin bir kısmını veya tamamını dahil eder. Belgelerdeki tüm metin ayrıca özel bir arama dizinine gönderilir.

Metin belgeleri için bağlam doldurma

Bu özellik aktif olarak geliştirilmektedir. Bu nedenle aşağıdaki ayrıntılar önceden haber verilmeksizin değiştirilebilir.

ChatGPT Enterprise, yüklenen belgelerden bağlam kapasitesi içinde 110 bin tokena kadar işleyebilir. Toplamı 110 bin tokendan az olan bir veya daha fazla belge yüklerseniz, içeriğin tamamı dahil edilir.

110 bin tokenı aşan tek bir belge için, yalnızca başlangıçtan itibaren ilk 110 bin token dahil edilir. Geri kalan kısım yalnızca özel arama dizinine gönderilir.

Birden çok belge yüklenirse ve bunların toplamı 110 bin tokenı aşarsa ChatGPT Enterprise, belge temsilini dengelemek için iki adımlı bir süreç kullanır:

  1. Yüklenen belgeler arasında eşit şekilde bölüştürülerek 55 bin tokena kadar çıkarın.

  1. İlk adımda tam olarak temsil edilmeyen belgeler için, kalan 55 bin tokenı her belgede kalan tokenlara göre orantılı olarak ayırın.

  1. Kalan tüm tokenlar yalnızca özel arama dizinine gönderilir.

Bir metin belgesindeki token sayısını, belgenin metnini OpenAI Tokenizer içine kopyalayarak tahmin edebilirsiniz.

Multimedya PDF’leri için bağlam doldurma

Kullanıcılar hem metin hem de görseller içeren PDF’ler yüklediğinde Görsel Getirme, ChatGPT’nin bu görselleri dijital olarak çıkarılan metinle birlikte yerel olarak işlemesini sağlar. Aşağıdaki adımlar, multimedya PDF’leri için standart bağlam işleme prosedürlerimizi tamamlar:

  • Görsel Çıkarma ve Gömme: Görseller çıkarılır ve ilişkili dijital metinleriyle birlikte gömülür.

  • Akıllı Ölçekleme: Görseller, bilgi kalitesi ile kullanılabilir bağlam kapasitesinin verimli kullanımı arasında dengeyi korumak için otomatik olarak ölçeklenir.

Yüklenen PDF’ler 110 bin token sınırını aştığında, hem görseller hem de metin özel arama dizinine gömülür. Metin gömmeleri ilgili görsellere referans verir; bu da ChatGPT’nin kullanıcı sorgularına göre uygun metin-görsel çiftlerini almasını sağlar. Alınan görseller daha sonra ChatGPT’nin yerel çok modlu yetenekleri kullanılarak işlenir.

Multimedya PDF’leri için token gereksinimlerini doğru tahmin etmek zordur. Testler, metin ve görsellerin karışık olduğu yaklaşık 350 sayfanın 110 bin tokenlık bağlam kapasitesini tamamen kullanacağını göstermektedir.

Model türüne dayalı arama stratejileri

Hem GPT serisi hem de o serisi modeller dosya yüklemelerini destekler ve aynı bağlam doldurma ile arama gömme mantığını kullanır. Tüm modeller, anahtar kelime ve anlamsal yöntemleri birleştirerek özel bir arama dizininde hibrit aramalar yürütür. Hibrit aramada model, kullanıcının komutuna göre bir arama ifadesi oluşturur ve özel arama dizini buna uygun ilgili metinleri ve görselleri getirir.

Ancak bu modeller, bağlam kapasitesini aşan büyük belgelerde arama yapma biçimleri bakımından farklılık gösterir:

GPT serisi modeller

  • Komut başına tek arama: GPT serisi modeller, kullanıcı komutu başına bir arama yapar.

  • Etkili kullanım alanları: Kapsamlı belgelerin içinde yer alan basit soruları yanıtlamak için idealdir.

Örnek sorgular:

  • “Erken emeklilik için İK politikası nedir?”

  • process_order işlevi ne yapar?”

o serisi modeller

  • Komut başına birden çok arama: Her kullanıcı komutu için, her biri benzersiz bir arama ifadesiyle birden çok arama (genellikle 2-3) yürütebilir. Aramalar sırayla yürütülür ve model, önceki aramalarda elde edilen bilgilere göre yaklaşımını güncelleyebilir.

  • Etkili kullanım alanları: Kapsamlı belgeler genelinde birden çok hedefli arama gerektiren karmaşık sorular için daha uygundur.

Örnek sorgular:

  • “Erken emeklilik, ebeveyn izni ve yurt dışı transferi için İK politikaları nelerdir?”

  • process_order işlevinin ne yaptığını açıklayın, bu işlev tarafından çağrılan tüm yöntemleri listeleyin ve çağrılan her yöntemi kısaca açıklayın.”

Güçlü yönlerine rağmen, o serisi modeller bir sorgu üçten fazla arama gerektirdiğinde zorlanabilir.

Dosya arama sonuçlarını iyileştirmeye yönelik ipuçları

  • Birden çok arama gerektiren karmaşık sorular için o serisi bir model kullanmayı deneyin.

  • Yanıtların, yüklediğiniz belgelerin türüne, sayısına ve boyutuna bağlı olarak değişebileceğini unutmayın.

  • Genel olarak, daha az sayıda ve odaklanmış belge yüklemek daha yüksek doğruluk sağlar.

  • Birden çok soru içeren konuları tekil sorulara dönüştürün:

    • Her eyaletin İK politikalarını bilmeniz gerekiyorsa, bunları tek tek sorun.

    • Birçok belgeyi özetlemeniz gerekiyorsa, her seferinde bir belge isteyin. Bu belge yüzlerce sayfaysa, onu daha küçük bileşenlere ayırmayı düşünün.

      • ChatGPT Enterprise’dan, tüm belgeler yerine birden çok özet sağladıysanız bir “özetlerin özetini” yazmasını isteyebilirsiniz.

    • Bir RFP’nin CSV’si varsa (her satır farklı bir sorudur), CSV’yi yükleyip tek bir yanıt istemek yerine bu soruları tek tek sorun.

  • Modelin yanıtlarını denetlemenin yollarını bulun. Örnek GPT talimatları aşağıdadır:

# Bağlam 

Belgeleri anlama konusunda uzmansınız. Kullanıcı bir belge ekleyecek ve bir soru soracak. Yanıtınızı aldığınız metnin tam olarak hangi bölümüne dayandığınızı görebilmeleri gerekir.

# Talimatlar

1. Kullanıcının sorusunu, eklediği belgeye dayanarak aşağıda verilen tam biçimi kullanarak yanıtlayın

# Biçim

- Soru: { kullanıcının sorusunu tekrarlayın }
- Yanıt: { kullanıcının sorusuna bir yanıt verin }
Kaynak:
- - Bölüm Numarası: { yanıtı aldığınız bölüm numarasını verin }
- - Bölüm Başlığı: { yanıtı aldığınız bölüm başlığını verin }
- - Tam Metin: { yanıtı aldığınız tam metni verin }

# Kurallar

- Açık ve kısa yanıtlar verin
- Yalnızca belgede verilen bilgileri sağlayın
- Belgede yanıtı bulamazsanız, yalnızca "Bilgi bulunamadı." diye yanıtlayın

Bu makale yararlı oldu mu?