OpenAI
Tämä sivu on konekäännetty. Katso alkuperäinen englanninkielinen artikkeli.

Assistants API (v2) UKK

Päivitetty: 4 days ago

11. maaliskuuta 2025 alkaen olemme julkaisseet uuden Agents-alustamme perusrakennuspalikat. Lisätietoja löydät API-dokumentaatiostamme: Responses API, työkalut kuten Web Search, File Search ja Computer Use, sekä Agents SDK ja sen Tracing. Assistants API -betasta saamasi palautteen pohjalta olemme sisällyttäneet tärkeimmät parannukset Responses APIin. Kun olemme saavuttaneet täyden ominaisuusvastaavuuden, ilmoitamme myöhemmin tänä vuonna Assistants API:n käytöstäpoistosuunnitelmasta, ja tavoitteena on lopettaa palvelu vuoden 2026 ensimmäisellä puoliskolla.

Mikä on Assistants API?

Assistants API antaa kehittäjille mahdollisuuden rakentaa helposti tehokkaita AI-avustajia sovelluksiinsa. Tämä API poistaa tarpeen hallita keskusteluhistoriaa ja tuo käyttöön OpenAI:n ylläpitämät työkalut, kuten koodintulkitsin ja File Search. API tukee myös parannettua Toiminnon kutsumista kolmannen osapuolen työkaluille.

Voinko edelleen käyttää Assistants API v1 -betaa?

En. 18. joulukuuta 2024 alkaen käyttäjillä ei ole enää pääsyä Assistant API -betan v1-versioon. Tällä hetkellä tuemme vain v2:ta. Katso tämä migraatio-opas, jonka avulla voit muuntaa API-kutsusi versiosta v1 versioon v2

Miten pääsen siihen käsiksi?

Assistants API on saatavilla kaikille, joilla on OpenAI API -tili. Voit myös aloittaa Assistants Playgroundin kautta.

Mikä on Assistant?

Assistant edustaa tiettyyn tarkoitukseen rakennettua tekoälyä, joka käyttää OpenAI:n malleja ja voi käyttää tiedostoja, ylläpitää pysyviä säikeitä ja kutsua työkaluja.

Mikä on Thread?

Thread on avustajan ja käyttäjän välinen keskusteluistunto. Threadit yksinkertaistavat sovelluskehitystä tallentamalla viestihistorian ja katkaisemalla sitä, kun keskustelu kasvaa liian pitkäksi mallin kontekstipituudelle.

Mikä on File Search -työkalu?

file_search-työkalu toteuttaa useita tiedonhaun parhaita käytäntöjä valmiiksi, jotta voit poimia tiedostoistasi oikeat tiedot mallin vastausten tueksi. Lisätietoja saat kehittäjädokumentaatiostamme.

Oletuksena file_search-työkalu käyttää seuraavia asetuksia:

  • Lohkon koko: 800 tokenia

  • Lohkojen päällekkäisyys: 400 tokenia

  • Upotusmalli: text-embedding-3-large, 256 ulottuvuutta

  • Kontekstiin lisättävien lohkojen enimmäismäärä: 20

Mitkä ovat tiedoston latauksen rajoitukset?

Tiedoston latauksen rajoitukset ovat:

  • 512 Mt tiedostoa kohden

  • 5 M tokenia tiedostoa kohden

  • 10k tiedostoa vektorivarastoa kohden

  • 1 vektorivarasto avustajaa kohden

  • 1 vektorivarasto threadia kohden

Kokonaisvarastoraja kullekin organisaation projektille on 100 Gt.

Mitkä ovat File Search -työkalun rajoitukset?

Meillä on muutamia tunnettuja rajoituksia, joihin lisäämme tukea tulevien kuukausien aikana:

  1. Tällä hetkellä lohkomisen, upotusten tai tiedonhaun asetuksia ei voi muokata.

  2. Emme tue asiakirjoissa olevien kuvien jäsentämistä.

  3. Emme tue tiedonhakua rakenteisista tiedostomuodoista (kuten .csv- tai .jsonl-tiedostot). Katso tuetut tiedostotyypit.

Mitkä ovat Assistants API:n nopeusrajoitukset?

Assistants API:n nopeusrajoitukset eivät ole sidottuja käyttötasoon ja malliin. Sen sijaan käytössä on oletusrajat pyyntötyypeittäin, muutamaa poikkeusta lukuun ottamatta:

  • GET: 1000 RPM

  • POST: 300 RPM

    • POST osoitteeseen /v1/threads/<thread_id>/runs: 200 RPM

    • POST osoitteeseen /v1/threads/runs: 200 RPM

  • DELETE: 300 pyyntöä minuutissa

Miten API:n koodintulkitsimen hinnoittelu toimii?

koodintulkitsin maksaa 0,03 $ / istunto. Jos avustajasi kutsuu koodintulkitinta samanaikaisesti kahdessa eri threadissa, tästä syntyy kaksi koodintulkitsin-istuntoa (2 * 0,03 $). Kukin istunto on oletuksena aktiivinen yhden tunnin ajan, mikä tarkoittaa, että maksat tämän maksun vain kerran, jos käyttäjäsi jatkaa ohjeiden antamista koodintulkitsimelle samassa threadissa enintään yhden tunnin ajan.

Miten API:n File Searchin hinnoittelu toimii?

File Search maksaa 0,10 $/Gt vektorivaraston tallennustilaa päivässä (ensimmäinen gigatavu tallennustilaa on ilmainen). Vektorivaraston koko perustuu sen lopulliseen kokoon sen jälkeen, kun tiedostosi on jäsennetty, pilkottu ja upotettu.

Kaikki ennen 17. huhtikuuta 2024 luodut vektorivarastot ovat maksuttomia vuoden 2024 loppuun asti, minkä jälkeen ne joko:

  • laskutetaan nykyisten hintojen mukaan (tällä hetkellä 0,10 $/Gt/päivä), jos niitä on käytetty vähintään kerran 17. huhtikuuta 2024 jälkeen luodussa Runissa.

  • poistetaan, jos niitä ei ole käytetty kertaakaan yhdessäkään Runissa 17. huhtikuuta 2024 ja 31. joulukuuta 2024 välillä — näin vältetään se, että sinua laskutetaan vektorivarastoista, jotka olet ehkä luonut ennen tämän hinnanmuutoksen ilmoittamista mutta joita et ole koskaan käyttänyt.

Onko luotavien avustajien määrälle rajaa?

Organisaation luomien avustajien määrälle ei ole rajaa.

Onko suoratoisto saatavilla API:ssa?

Kyllä, suoratoisto on saatavilla Assistants API:ssa.

Onko JSON-tila saatavilla Assistants API:ssa?

Kyllä, JSON-tila on saatavilla Assistants API:ssa response_format-parametrin kautta Assistants- tai Run-objekteissa.

Hallitseeko Assistants API myös kolmannen osapuolen Toiminnon kutsumisen pyyntöjä?

Ei. Vaikka Toiminnon kutsuminen antaa mallin valita työkaluja ja muotoilla niille pyyntöjä, kolmannen osapuolen työkalujen kutsujen suorittamista ei hallinnoi OpenAI.

Miten OpenAI:lle lähettämäni dataa käsitellään?

Kuten muuallakin alustallamme, OpenAI API:lle välitettyjä tietoja ja tiedostoja ei koskaan käytetä malliemme kouluttamiseen, ja voit poistaa tietosi milloin tahansa. Assistants API:in ladattu data tallennetaan toistaiseksi, kunnes käyttäjä poistaa sen manuaalisesti.

Onko DALL-E saatavilla Assistants API:n kautta?

Tällä hetkellä DALL-E ei ole saatavilla.

Onko Assistants API:lle käyttöliittymää?

Voit tutustua Assistants API:n Playgroundiin. Varmista, että olet vasemman sivupalkin Assistants-näkymässä ja käytät mallia, joka on yhteensopiva niiden työkalujen kanssa, jotka haluat ottaa käyttöön.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

Mikä on avustajan ohjeiden merkkiraja Assistants API:ssa?

Assistantin käyttämien järjestelmäohjeiden enimmäispituus on 256 000 merkkiä.

Saan virheen kuten ”Palvelin kohtasi virheen pyyntöäsi käsitellessään. Pahoittelut! Voit yrittää pyyntöäsi uudelleen tai ottaa meihin yhteyttä ohjekeskuksen kautta osoitteessa help.openai.com, jos virhe jatkuu.” Mitä minun pitäisi tehdä?

Jos saat tämän virheen, se voi tarkoittaa, että kehotteesi ei ole määritetty oikein. Jos yrität pyyntöä uudelleen ja se epäonnistuu yhä, kokeile seuraavia:

  1. varmista, että rakennat kehotteesi uudelleen niin, että kaikki funktionkaltaiset komennot käsitellään toimintoina

  2. lisää kaikki kehotteesi komennot toimintona tools-kohtaan

Miksi File Search -työkaluni ei toimi hyvin?

Kun käytät File Search -työkalua, suosittelemme asettamaan max_prompt_tokens-arvoksi vähintään 20 000. Pidemmissä keskusteluissa tai useissa File Search -vuorovaikutuksissa harkitse tämän rajan nostamista 50 000:een tai mieluiten max_prompt_tokens-rajojen poistamista kokonaan parhaan laadun saavuttamiseksi. Lue lisää täältä.

Miten voin antaa palautetta?

Kuulemme mielellämme palautteesi kehittäjäfoorumillamme, ohjekeskuksen kautta osoitteessa help.openai.com tai Twitterissä @OpenAIDevs.

Oliko tästä artikkelista apua?