OpenAI
Tämä sivu on konekäännetty. Katso alkuperäinen englanninkielinen artikkeli.

Tiedostolatausten optimointi ChatGPT Enterprise -palvelussa

Ymmärrä, miten ChatGPT Enterprise -ominaisuudet käsittelevät tiedostoja niiden tyypin, määrän ja koon mukaan. Paranna tuloksia tiedostovaatimusten perusteella.

Päivitetty: yesterday

ChatGPT Enterprise tukee nyt kehotteisiin sisältyviin PDF-tiedostoihin upotettujen visuaalisten elementtien (kuvien, kaavioiden, diagrammien jne.) lukemista ja ymmärtämistä. Käyttäjät voivat ladata PDF-tiedoston, ja ChatGPT voi tulkita tekstin ja kaikki tiedoston visuaaliset elementit.

Lisätietoja on kohdassa Usein kysytyt kysymykset PDF-tiedostojen visuaalisesta hausta.

ChatGPT Enterprise antaa sinun ladata tiedostoja useilla tavoilla:

Tässä oppaassa selitetään, miten ChatGPT Enterprise -ominaisuudet käsittelevät tiedostoja niiden tyypin, määrän ja koon perusteella, ja käsitellään strategioita tulosten parantamiseen tiedostovaatimusten perusteella.

Yhteenveto

ChatGPT Enterprise käsittelee eri tiedostotyyppejä hyvin eri tavoin: se poimii tekstiä tekstiasiakirjoista, kuten PDF-, esitys- ja Word-tiedostoista, analysoi laskentataulukoiden rakenteista dataa Python-koodilla ja kuvailee kuvatiedostoja GPT-Visionin avulla. Odotetun tuloksen saamisessa on keskeistä ymmärtää, mikä tiedostotyyppi käynnistää minkäkin työnkulun.

Tekstipohjaisissa asiakirjoissa ChatGPT Enterprise sisällyttää mahdollisimman paljon olennaista tekstiä suoraan kehotteen rinnalle ja käyttää hakujärjestelmää lisätietojen hakemiseen. Tämä toimii hyvin tarkkoihin kysymyksiin vastaamisessa. Tällä lähestymistavalla voi kuitenkin olla vaikeuksia monimutkaisissa tehtävissä, kuten hyvin suurten asiakirjojen tiivistämisessä tai useiden suurten tiedostojen vertailussa. Lue lisää ymmärtääksesi strategioita tulostesi parantamiseen.

Tiedostojen käsittely tyypin mukaan

ChatGPT Enterprise käsittelee tiedostoja kolmella päätavalla: tekstin poiminta, koodianalyysi ja kuvien tulkinta. Tiedostotyyppi määrittää, mitä työnkulkua ChatGPT Enterprise noudattaa.

Tekstipohjainen hakuKoodintulkitsinKuvankäsittelyVisuaalinen haku
Esimerkkejä tiedostotyypeistäpptx, docx, txt, md, json, xml, pdf*
* PDF-tiedostot, jotka on ladattu

GPT Knowledge -tietona
tai

projektitiedostoina
csv, xls, xlsx*
*Huomautus: koodintulkitsin voi toimia minkä tahansa tiedostotyypin kanssa, mutta ChatGPT Enterprise käyttää laskentataulukoille useimmiten oletuksena CI:tä
jpg, pngpdf*
* Käyttäjän kehotteisiin sisältyvät PDF-tiedostot
ToimintaPoimii tekstin tiedostosta – osa tekstistä liitetään (”täytetään”) suoraan konteksti-ikkunaan; osa tekstistä tallennetaan hakua vartenKoodintulkitsin välittää tiedoston Pythonille käsiteltäväksiMultimodaaliset mallit tulkitsevat kuvat natiivisti, ja niihin sovelletaan

tunnettuja rajoituksia
.
Tekstihaun ja kuvankäsittelyn hybridi. Teksti poimitaan digitaalisesti, ja multimodaaliset mallit tulkitsevat visuaalisen sisällön natiivisti.

Pelkkää tekstiä sisältävien tiedostojen, kuvatiedostojen tai selkeästi rakenteisten datatiedostojen (esim. Excel-taulukko tapahtumista) kohdalla nämä jaottelut edustavat parasta mahdollista toimintaa.

On olemassa joitakin harmaita alueita, jotka eivät ole yhtä ilmeisiä, esimerkiksi:

  • Muihin kuin PDF-tiedostoihin upotettuja kuvia ei käsitellä. Jos haluat sisällyttää ne, muunna tiedosto PDF-muotoon ennen lataamista.

  • ChatGPT Enterprise käyttää aina koodintulkitsinta laskentataulukoiden käsittelyyn, vaikka asiakirja sisältäisi suuren määrän tekstiä. Jos esimerkiksi pyydät ChatGPT Enterprisea kääntämään CSV-tiedoston, jossa on 10 tekstiriviä, se yrittää kääntää tiedoston Python-kirjaston avulla, mikä on epätarkempaa kuin antaa mallin luoda käännös suoraan. Tämän lieventämiseksi kokeile viedä laskentataulukko tekstipohjaiseen muotoon (esimerkiksi PDF:ksi).

  • Vastaavasti, jos lataat JSON-tiedostossa olevan rakenteisen tapahtumataulukon, ChatGPT Enterprise tulkitsee tämän tiedoston pelkkänä tekstinä. Jos haluat analysoida JSON-tiedostossa olevia tietoja, ohjeista mallia käyttämään koodintulkitsinta kehotteessasi.

Tiedostojen käsittely koon mukaan

ChatGPT Enterprise käyttää malleja, joiden konteksti-ikkuna on enintään 128k tokenia (noin 200 sivua tekstiä). Kaikkia tokeneita ei kuitenkaan käytetä ladatuista tiedostoista peräisin olevan tekstin sisällyttämiseen. ”Täytettyjen” tokenien määrä vaihtelee käyttötavan mukaan.

ChatGPT Enterprise ”täyttää” jonkin verran tekstiä, ja jäljelle jäävä teksti lähetetään yksityiseen hakuindeksiin (”vektorivarastoon”, joka on tietokantatyyppi, joka on suunniteltu tallentamaan ja noutamaan tehokkaasti suuria tekstimääriä). Kun esität kysymyksen, ChatGPT Enterprise tuo mukaan sisällytetyn tekstin sekä yksityisestä hakuindeksistä noudetut olennaiset osat.

Jos lataat yhden asiakirjan, ChatGPT Enterprise sisällyttää tekstiä alusta alkaen, kunnes sen raja tulee vastaan. Jos lataat useita asiakirjoja, ChatGPT Enterprise sisällyttää osan kustakin asiakirjasta tai ne kokonaan. Kaikki asiakirjojen teksti lähetetään myös yksityiseen hakuindeksiin.

Kontekstin täyttäminen tekstiasiakirjoille

Tämä ominaisuus on aktiivisen kehityksen alla. Siksi seuraavat tiedot voivat muuttua ilman erillistä ilmoitusta.

ChatGPT Enterprise voi käsitellä ladatuista asiakirjoista enintään 110k tokenia konteksti-ikkunassa. Jos lataat yhden tai useamman asiakirjan, joiden yhteenlaskettu määrä on alle 110k tokenia, koko sisältö sisällytetään.

Yhdestä asiakirjasta, joka ylittää 110k tokenia, sisällytetään vain ensimmäiset 110k tokenia alusta alkaen. Loppuosa lähetetään vain yksityiseen hakuindeksiin.

Jos ladataan useita asiakirjoja ja niiden yhteenlaskettu määrä ylittää 110k tokenia, ChatGPT Enterprise tasapainottaa asiakirjojen edustuksen kaksivaiheisella prosessilla:

  1. Poimi enintään 55k tokenia, jaettuna tasaisesti ladattujen asiakirjojen kesken.

  1. Asiakirjoille, joita ei edusteta kokonaan ensimmäisessä vaiheessa, jaa loput 55k tokenia suhteellisesti kussakin asiakirjassa jäljellä olevien tokenien perusteella.

  1. Mahdolliset jäljellä olevat tokenit lähetetään vain yksityiseen hakuindeksiin.

Voit arvioida tekstiasiakirjan tokenien määrän kopioimalla asiakirjan tekstin OpenAI-tokenisoijaan.

Kontekstin täyttäminen multimedia-PDF-tiedostoille

Kun käyttäjät lataavat sekä tekstiä että kuvia sisältäviä PDF-tiedostoja, visuaalinen haku mahdollistaa sen, että ChatGPT voi käsitellä näitä kuvia natiivisti digitaalisesti poimitun tekstin rinnalla. Seuraavat vaiheet täydentävät multimedia-PDF-tiedostojen vakiomenettelyjämme kontekstin käsittelyssä:

  • Kuvien poiminta ja upottaminen: Kuvat poimitaan ja upotetaan niihin liittyvän digitaalisen tekstin kanssa.

  • Älykäs skaalaus: Kuvat skaalataan automaattisesti niin, että tiedon laadun ja käytettävissä olevan konteksti-ikkunan tehokkaan käytön välinen tasapaino säilyy.

Kun ladatut PDF-tiedostot ylittävät 110k tokenin rajan, sekä kuvat että teksti upotetaan yksityiseen hakuindeksiin. Tekstiupotukset viittaavat olennaisiin kuviin, jolloin ChatGPT voi noutaa sopivat teksti-kuvaparit käyttäjien kyselyjen perusteella. Noudetut kuvat käsitellään sitten ChatGPT:n natiivien multimodaalisten ominaisuuksien avulla.

Multimedia-PDF-tiedostojen tokenitarpeiden tarkka arviointi on haastavaa. Testien perusteella noin 350 sivua yhdistettyä tekstiä ja kuvia käyttää 110k tokenin konteksti-ikkunan kokonaan.

Hakustrategiat mallityypin mukaan

Sekä GPT-sarjan että o-sarjan mallit tukevat tiedostojen lataamista ja käyttävät samaa kontekstin täyttämisen ja haku-upotusten logiikkaa. Kaikki mallit suorittavat hybridihaun yksityistä hakuindeksiä vasten ja yhdistävät avainsana- ja semanttisia menetelmiä. Hybridihaussa malli luo käyttäjän kehotteen perusteella hakulausekkeen, ja yksityinen hakuindeksi noutaa sen mukaisesti olennaista tekstiä ja kuvia.

Nämä mallit eroavat kuitenkin siinä, miten ne hakevat suurista asiakirjoista, jotka ylittävät konteksti-ikkunan:

GPT-sarjan mallit

  • Yksi haku kehotetta kohti: GPT-sarjan mallit suorittavat yhden haun käyttäjän kehotetta kohti.

  • Tehokkaat käyttötapaukset: Ihanteellinen laajaan dokumentaatioon sisältyviin yksinkertaisiin kysymyksiin vastaamiseen.

Esimerkkikyselyt:

  • ”Mikä on HR-käytäntö varhaiseläkkeelle?”

  • ”Mitä process_order-funktio tekee?”

o-sarjan mallit

  • Useita hakuja kehotetta kohti: Voi suorittaa useita hakuja (yleensä 2–3) käyttäjän kehotetta kohti, jokaisella oma hakulauseke. Haut suoritetaan peräkkäin, ja malli voi päivittää lähestymistapaansa aiemmissa hauissa haettujen tietojen perusteella.

  • Tehokkaat käyttötapaukset: Sopii paremmin monimutkaisiin kysymyksiin, jotka vaativat useita kohdennettuja hakuja laajasta dokumentaatiosta.

Esimerkkikyselyt:

  • ”Mitkä ovat HR-käytännöt varhaiseläkkeelle, vanhempainvapaalle ja ulkomaille siirtymiselle?”

  • ”Selitä, mitä process_order-funktio tekee, luettele kaikki tämän funktion kutsumat metodit ja kuvaile lyhyesti kutakin kutsuttua metodia.”

Vahvuuksistaan huolimatta o-sarjan malleilla voi olla vaikeuksia, kun kysely vaatii yli kolme hakua.

Vinkkejä tiedostohaun tulosten parantamiseen

  • Kokeile o-sarjan mallia monimutkaisiin kysymyksiin, jotka vaativat useita hakuja.

  • Muista, että vastaukset voivat vaihdella lataamiesi asiakirjojen tyypin, määrän ja koon mukaan.

  • Yleensä vähemmän, kohdennettuja asiakirjoja lataamalla saavutetaan parempi tarkkuus.

  • Muuta monikysymyksiset aiheet yksittäisiksi kysymyksiksi:

    • Jos sinun on tiedettävä jokaisen osavaltion HR-käytännöt, kysy niistä yksi kerrallaan.

    • Jos sinun on tehtävä yhteenveto monista asiakirjoista, pyydä käsittelemään yksi asiakirja kerrallaan. Jos kyseinen asiakirja on satoja sivuja pitkä, harkitse sen jakamista pienempiin osiin.

      • Voisit pyytää ChatGPT Enterprisea kirjoittamaan ”yhteenvetojen yhteenvedon”, jos syötät sille useita yhteenvetoja kokonaisten asiakirjojen sijaan.

    • Jos sinulla on RFP:n CSV-tiedosto (jokainen rivi on eri kysymys), kysy nämä kysymykset yksi kerrallaan sen sijaan, että vain lataisit CSV-tiedoston ja pyytäisit yhtä vastausta.

  • Etsi tapoja auditoida mallin vastauksia. Esimerkkejä GPT-ohjeista on alla:

# Konteksti 

Olet asiantuntija asiakirjojen ymmärtämisessä. Käyttäjä liittää asiakirjan ja esittää kysymyksen. Hänen täytyy pystyä yhdistämään vastauksesi tarkkaan siihen tekstin kohtaan, josta otit vastauksen.

# Ohjeet

1. Vastaa käyttäjän kysymykseen hänen liitetyn asiakirjansa perusteella käyttäen täsmälleen alla annettua muotoa

# Muoto

- Kysymys: { toista käyttäjän kysymys }
- Vastaus: { anna vastaus käyttäjän kysymykseen }
Lähde:
- - Osion numero: { anna osion numero, josta otit vastauksen }
- - Osion otsikko: { anna osion otsikko, josta otit vastauksen }
- - Tarkka teksti: { anna tarkka teksti, josta otit vastauksen }

# Säännöt

- Anna vastaukset selkeinä ja ytimekkäinä
- Anna vain asiakirjassa annettuja tietoja
- Jos et löydä vastausta asiakirjasta, vastaa yksinkertaisesti ”Tietoa ei löytynyt.”

Oliko tästä artikkelista apua?