ChatGPT Enterprise sada podržava čitanje i razumijevanje vizuala (slika, grafikona, dijagrama itd.) ugrađenih u PDF datoteke uključene u upite. Korisnici mogu prenijeti PDF, a ChatGPT može protumačiti tekst i sve vizualne elemente unutar te datoteke.
Pojedinosti potražite u Čestim pitanjima o vizualnom dohvaćanju s PDF-ovima.
ChatGPT Enterprise omogućuje vam prijenos datoteka na nekoliko načina:
Izravno s vašeg računala
S usluga Google Drive / SharePoint / OneDrive
Kao GPT znanje
Iz GPT radnje
U ovom se vodiču objašnjava kako značajke ChatGPT Enterprisea rukuju datotekama na temelju njihove vrste, broja i veličine te se razmatraju strategije za poboljšanje izlaza na temelju zahtjeva datoteka.
Sažetak
ChatGPT Enterprise vrlo različito obrađuje različite vrste datoteka: izdvaja tekst iz tekstnih dokumenata kao što su PDF-ovi, prezentacije i Word datoteke, analizira strukturirane podatke iz proračunskih tablica pomoću Python koda te opisuje slikovne datoteke putem GPT-Visiona. Razumijevanje koja vrsta datoteke pokreće koji tijek rada ključno je za dobivanje očekivanog rezultata.
Za tekstne dokumente ChatGPT Enterprise uključuje što je više moguće relevantnog teksta izravno uz upit i upotrebljava sustav pretraživanja za pristup dodatnim informacijama. To dobro funkcionira za odgovaranje na konkretna pitanja. Međutim, ovaj pristup može imati poteškoća sa složenim zadacima poput sažimanja vrlo velikih dokumenata ili usporedbe više velikih datoteka. Nastavite čitati kako biste razumjeli strategije za poboljšanje svojih rezultata.
Rukovanje datotekama na temelju vrste
ChatGPT Enterprise obrađuje datoteke na tri glavna načina: izdvajanje teksta, analiza koda i tumačenje slika. Vrsta datoteke određuje koji tijek rada ChatGPT Enterprise slijedi.
| Dohvaćanje temeljeno na tekstu | Interpreter koda | Obrada slika | Vizualno dohvaćanje | |
|---|---|---|---|---|
| Primjeri vrsta datoteka | pptx, docx, txt, md, json, xml, pdf* * PDF-ovi preneseni kao GPT znanje ili projektne datoteke | csv, xls, xlsx* *Napomena: Interpreter koda može raditi s bilo kojom vrstom datoteke, ali ChatGPT Enterprise najčešće prema zadanim postavkama upotrebljava CI za proračunske tablice | jpg, png | pdf* * PDF-ovi uključeni u korisničke upite |
| Ponašanje | Izdvaja tekst iz datoteke – dio teksta lijepi se („umeće”) izravno u kontekstni prozor; dio teksta pohranjuje se za pretraživanje | Interpreter koda prosljeđuje datoteku Pythonu radi obrade | Slike izvorno tumače multimodalni modeli, uz poznata ograničenja . | Hibrid dohvaćanja teksta i obrade slika. Tekst se digitalno izdvaja, a vizualni sadržaj izvorno tumače multimodalni modeli. |
Za datoteke samo s tekstom, slikovne datoteke ili jasno strukturirane podatkovne datoteke (npr. Excel tablicu transakcija), ove podjele predstavljaju najbolje moguće ponašanje.
Postoje neka siva područja koja su manje očita, na primjer:
Slike ugrađene u datoteke koje nisu PDF-ovi ne obrađuju se. Da biste ih uključili, prije prijenosa pretvorite datoteku u PDF.
ChatGPT Enterprise uvijek će upotrebljavati Interpreter koda za interakciju s proračunskim tablicama, čak i ako dokument sadrži veliku količinu teksta. Na primjer, ako od ChatGPT Enterprisea zatražite da prevede CSV datoteku s 10 redaka teksta, pokušat će prevesti datoteku pomoću Python biblioteke, što je manje točno nego dopustiti modelu da izravno generira prijevod. Kako biste to ublažili, pokušajte izvesti proračunsku tablicu u tekstni format (na primjer PDF).
Slično tome, ako prenesete strukturiranu transakcijsku tablicu sadržanu u JSON datoteci, ChatGPT Enterprise protumačit će tu datoteku kao običan tekst. Ako želite analizirati podatke sadržane u JSON datoteci, uputite model da u vašem upitu upotrijebi Interpreter koda.
Rukovanje datotekama na temelju veličine
ChatGPT Enterprise upotrebljava modele s maksimalnim kontekstnim prozorom od 128 tisuća tokena (otprilike 200 stranica teksta). Međutim, ne upotrebljavaju se svi tokeni za uključivanje teksta iz prenesenih datoteka. Broj „umetnutih” tokena razlikuje se ovisno o vrsti upotrebe.
ChatGPT Enterprise „umeće” određenu količinu teksta, a preostali tekst šalje se u privatni indeks pretraživanja („vektorska pohrana”, vrsta baze podataka osmišljena za učinkovitu pohranu i dohvaćanje velikih količina teksta). Kada postavite pitanje, ChatGPT Enterprise uključuje uvršteni tekst zajedno s relevantnim isječcima dohvaćenima iz privatnog indeksa pretraživanja.
Ako prenesete jedan dokument, ChatGPT Enterprise uključuje tekst od početka dok ne dosegne svoje ograničenje. Ako prenesete više dokumenata, ChatGPT Enterprise uključuje dio ili sav sadržaj svakog dokumenta. Sav tekst iz dokumenata također se šalje u privatni indeks pretraživanja.
Umetanje konteksta za tekstne dokumente
Ta je značajka u aktivnom razvoju. Stoga su sljedeće pojedinosti podložne promjenama bez prethodne obavijesti.
ChatGPT Enterprise može obraditi do 110 tisuća tokena iz prenesenih dokumenata u kontekstnom prozoru. Ako prenesete jedan ili više dokumenata s ukupno manje od 110 tisuća tokena, bit će uključen cijeli sadržaj.
Za jedan dokument koji premašuje 110 tisuća tokena bit će uključeno samo prvih 110 tisuća tokena, počevši od početka. Ostatak će se poslati samo u privatni indeks pretraživanja.
Ako je preneseno više dokumenata i njihov ukupan broj premašuje 110 tisuća tokena, ChatGPT Enterprise upotrebljava postupak u dva koraka za uravnoteženu zastupljenost dokumenata:
Izdvojite do 55 tisuća tokena, podijeljenih ravnomjerno među prenesenim dokumentima.
Za dokumente koji nisu u potpunosti zastupljeni u prvom koraku dodijelite preostalih 55 tisuća tokena proporcionalno na temelju tokena preostalih u svakom dokumentu.
Svi preostali tokeni šalju se samo u privatni indeks pretraživanja.
Broj tokena u tekstnom dokumentu možete procijeniti kopiranjem teksta dokumenta u OpenAI Tokenizer.
Umetanje konteksta za multimedijske PDF-ove
Kada korisnici prenesu PDF-ove koji sadrže i tekst i slike, Vizualno dohvaćanje omogućuje ChatGPT-u izvornu obradu tih slika zajedno s digitalno izdvojenim tekstom. Sljedeći koraci nadopunjuju naše standardne postupke za rukovanje kontekstom za multimedijske PDF-ove:
Izdvajanje i ugrađivanje slika: Slike se izdvajaju i ugrađuju zajedno s povezanim digitalnim tekstom.
Inteligentno skaliranje: Slike se automatski skaliraju radi održavanja ravnoteže između kvalitete informacija i učinkovite upotrebe dostupnog kontekstnog prozora.
Kada preneseni PDF-ovi premašuju ograničenje od 110 tisuća tokena, i slike i tekst ugrađuju se u privatni indeks pretraživanja. Tekstne ugradnje upućuju na relevantne slike, što ChatGPT-u omogućuje dohvaćanje odgovarajućih parova teksta i slike na temelju korisničkih upita. Dohvaćene slike zatim se obrađuju pomoću izvornih multimodalnih mogućnosti ChatGPT-a.
Točna procjena potreba za tokenima za multimedijske PDF-ove zahtjevna je. Testiranja pokazuju da će otprilike 350 stranica mješovitog teksta i slika u potpunosti iskoristiti kontekstni prozor od 110 tisuća tokena.
Strategije pretraživanja na temelju vrste modela
Modeli serije GPT i serije o podržavaju prijenos datoteka te upotrebljavaju istu logiku umetanja konteksta i ugradnji za pretraživanje. Svi modeli izvršavaju hibridna pretraživanja privatnog indeksa pretraživanja, kombinirajući metode temeljene na ključnim riječima i semantičke metode. U hibridnom pretraživanju model generira frazu za pretraživanje na temelju korisnikova upita, a privatni indeks pretraživanja prema tome dohvaća relevantan tekst i slike.
Međutim, ti se modeli razlikuju po načinu pretraživanja velikih dokumenata koji premašuju kontekstni prozor:
modeli serije GPT
Jedno pretraživanje po upitu: Modeli serije GPT provode jedno pretraživanje po korisničkom upitu.
Učinkoviti slučajevi upotrebe: Idealni su za odgovaranje na jednostavna pitanja ugrađena u opsežnu dokumentaciju.
Primjeri upita:
„Koja su HR pravila za prijevremenu mirovinu?”
„Što radi funkcija
process_order?”
modeli serije o
Više pretraživanja po upitu: Mogu izvršiti više pretraživanja (obično 2 – 3) po korisničkom upitu, svako s jedinstvenom frazom za pretraživanje. Pretraživanja se izvršavaju sekvencijalno, a model može ažurirati svoj pristup na temelju informacija dohvaćenih u prethodnim pretraživanjima.
Učinkoviti slučajevi upotrebe: Prikladniji su za složena pitanja koja zahtijevaju više ciljanih pretraživanja opsežne dokumentacije.
Primjeri upita:
„Koja su HR pravila za prijevremenu mirovinu, roditeljski dopust i premještaj u inozemstvo?”
„Objasni što radi funkcija
process_order, navedi sve metode koje ta funkcija poziva i ukratko opiši svaku pozvanu metodu.”
Unatoč svojim prednostima, modeli serije o mogu imati poteškoća kada upit zahtijeva više od tri pretraživanja.
Savjeti za poboljšanje rezultata pretraživanja datoteka
Pokušajte upotrijebiti model serije o za složena pitanja koja zahtijevaju više pretraživanja.
Imajte na umu da se odgovori mogu razlikovati ovisno o vrsti, broju i veličini dokumenata koje prenesete.
Općenito, učitavanje manjeg broja fokusiranih dokumenata dovest će do veće točnosti.
Teme s više pitanja pretvorite u pojedinačna pitanja:
Ako trebate znati HR pravila svake države, pitajte jedno po jedno.
Ako trebate sažeti mnogo dokumenata, tražite jedan po jedan dokument. Ako taj dokument ima više stotina stranica, razmislite o njegovu raščlanjivanju na manje dijelove.
Od ChatGPT Enterprisea mogli biste zatražiti da napiše „sažetak sažetaka” ako mu dostavite više sažetaka umjesto cijelih dokumenata.
Ako imate CSV RFP-a (svaki je redak drugo pitanje), postavljajte ta pitanja jedno po jedno umjesto da samo učitate CSV i zatražite jedan odgovor.
Pronađite načine za provjeru odgovora modela. Primjeri GPT uputa navedeni su u nastavku:
# Kontekst
Stručnjak ste za razumijevanje dokumenata. Korisnik će priložiti dokument i postaviti pitanje. Mora moći povezati vaš odgovor s točnim dijelom teksta iz kojeg ste preuzeli odgovor.
# Upute
1. Odgovorite na korisnikovo pitanje na temelju priloženog dokumenta točno u nastavku navedenom formatu
# Format
- Pitanje: { ponovite korisnikovo pitanje }
- Odgovor: { pružite odgovor na korisnikovo pitanje }
Izvor:
- - Broj odjeljka: { navedite broj odjeljka iz kojeg ste preuzeli odgovor }
- - Naslov odjeljka: { navedite naslov odjeljka iz kojeg ste preuzeli odgovor }
- - Točan tekst: { navedite točan tekst iz kojeg ste preuzeli odgovor }
# Pravila
- Dajte jasne i sažete odgovore
- Navodite samo informacije iz dokumenta
- Ako ne možete pronaći odgovor u dokumentu, jednostavno odgovorite „Nisu pronađene informacije.”