Od 11. ožujka 2025. objavili smo gradivne elemente naše nove platforme Agents. Za pojedinosti pogledajte našu API dokumentaciju za Responses API, alate uključujući Web Search, File Search i Computer Use, te naš Agents SDK s Tracingom. Na temelju vaših povratnih informacija o beta izdanju Assistants API-ja, ugradili smo ključna poboljšanja u Responses API. Nakon što postignemo potpunu usklađenost značajki, kasnije ove godine najavit ćemo plan ukidanja Assistants API-ja, s ciljanim datumom povlačenja u prvoj polovici 2026.
Što je Assistants API?
Assistants API razvojnim programerima omogućuje jednostavnu izradu moćnih AI asistenata unutar njihovih aplikacija. Ovaj API uklanja potrebu za upravljanjem poviješću razgovora i dodaje pristup alatima koje hostira OpenAI, kao što su Interpreter koda i File Search. API podržava i poboljšano pozivanje funkcija za alate trećih strana.
Mogu li i dalje koristiti Assistants API v1 beta?
Ne. Od 18. prosinca 2024. korisnici više nemaju pristup verziji v1 beta izdanja Assistant API-ja. Trenutačno podržavamo samo v2. Pogledajte ovaj vodič za migraciju kako biste API pozive pretvorili iz v1 u v2
Kako mu mogu pristupiti?
Assistants API dostupan je svima s OpenAI API računom, ali je zastario i bit će uklonjen u kolovozu 2026. Za nove projekte umjesto njega koristite Responses API. Ako već koristite Assistants API, planirajte migraciju na Responses API. Postojećim asistentima i dalje možete pristupati u Assistants Playgroundu dok je API dostupan.
Što je asistent?
Asistent predstavlja namjenski izgrađenu AI koja koristi OpenAI-jeve modele te može pristupati datotekama, održavati trajne niti i pozivati alate.
Što je nit?
Nit je sesija razgovora između asistenta i korisnika. Niti pojednostavnjuju razvoj aplikacija pohranjivanjem povijesti poruka i njezinim skraćivanjem kad razgovor postane predug za duljinu konteksta modela.
Što je alat File Search?
Alat `file_search` odmah primjenjuje nekoliko najboljih praksi dohvaćanja kako bi vam pomogao izdvojiti prave podatke iz datoteka za proširenje odgovora modela. Za više informacija pročitajte našu dokumentaciju za razvojne programere.
Prema zadanim postavkama, alat file_search koristi sljedeće postavke:
Veličina odlomka: 800 tokena
Preklapanje odlomaka: 400 tokena
Model ugrađivanja: `text-embedding-3-large` s 256 dimenzija
Maksimalan broj odlomaka dodanih u kontekst: 20
Koja su ograničenja za prijenos datoteka?
Ograničenja za prijenos datoteke su:
512 MB po datoteci
5 mil. tokena po datoteci
10 tis. datoteka po vektorskom spremištu
1 vektorsko spremište po asistentu
1 vektorsko spremište po niti
Ukupno ograničenje pohrane za svaki projekt u organizaciji iznosi 100 GB.
Koja su ograničenja alata File Search?
Postoji nekoliko poznatih ograničenja za koja radimo na dodavanju podrške u nadolazećim mjesecima:
Trenutačno ne postoji način za izmjenu postavki dijeljenja na odlomke, ugrađivanja ili dohvaćanja.
Ne podržavamo raščlanjivanje slika unutar dokumenata.
Ne podržavamo dohvaćanja preko strukturiranih formata datoteka (poput datoteka .csv ili .jsonl). Pogledajte podržane vrste datoteka.
Koja su ograničenja broja zahtjeva za Assistants API?
Ograničenja broja zahtjeva za Assistants API nisu vezana uz razinu upotrebe i model. Umjesto toga, postoje zadana ograničenja prema vrsti zahtjeva, uz nekoliko iznimaka:
GET: 1000 RPM
POST: 300 RPM
DELETE: 300 zahtjeva u minuti
Kako se naplaćuje Interpreter koda u API-ju?
Interpreter koda naplaćuje se 0,03 USD po sesiji. Ako vaš asistent istovremeno pozove Interpreter koda u dvije različite niti, to bi stvorilo dvije sesije Interpretera koda (2 * 0,03 USD). Svaka je sesija prema zadanim postavkama aktivna jedan sat, što znači da biste tu naknadu platili samo jednom ako korisnik nastavi davati upute Interpreteru koda u istoj niti do jednog sata.
Kako se naplaćuje File Search u API-ju?
File Search naplaćuje se 0,10 USD/GB pohrane vektorskog spremišta dnevno (prvi GB pohrane je besplatan). Veličina vektorskog spremišta temelji se na rezultirajućoj veličini vektorskog spremišta nakon što se vaša datoteka raščlani, podijeli na odlomke i ugradi.
Sva vektorska spremišta stvorena prije 17. travnja 2024. bit će besplatna do kraja 2024., nakon čega će biti:
Naplaćena po trenutačnim cijenama (trenutačno 0,10 USD/GB/dan) ako su upotrijebljena barem jednom u Runu stvorenom nakon 17. travnja 2024.
Izbrisana ako nisu upotrijebljena ni u jednom Runu između 17. travnja 2024. i 31. prosinca 2024. — time se izbjegava naplata za vektorska spremišta koja ste možda stvorili prije najave ove promjene cijena, ali ih nikad niste upotrijebili.
Postoji li ograničenje broja asistenata koje mogu stvoriti?
Ne postoji ograničenje broja asistenata koje organizacija može stvoriti.
Je li streaming dostupan u API-ju?
Da, streaming je dostupan u Assistants API-ju.
Je li JSON način rada dostupan u Assistants API-ju?
Da, JSON način rada dostupan je u Assistants API-ju putem parametra response_format na objektima Assistants ili Run.
Hoće li Assistants API upravljati i zahtjevima za pozive funkcija trećih strana?
Ne. Iako pozivanje funkcija omogućuje modelu odabir alata i formatiranje zahtjeva za njih, izvršavanjem poziva alatima trećih strana ne upravlja OpenAI.
Kako se postupa s podacima koje šaljem OpenAI-ju?
Kao i s ostatkom naše platforme, podaci i datoteke poslani OpenAI API-ju nikada se ne koriste za treniranje naših modela i svoje podatke možete izbrisati kad god vam je potrebno. Podaci preneseni u Assistants API pohranjuju se neograničeno dok ih korisnik ručno ne izbriše.
Je li DALL-E dostupan putem Assistants API-ja?
DALL-E trenutačno nije dostupan.
Postoji li UI za Assistants API?
Možete pogledati Playground za Assistants API. Provjerite jeste li u prikazu Assistants na liječnoj bočnoj traci i koristite model kompatibilan s alatima koje želite uključiti.

Koje je ograničenje broja znakova za upute asistentu u Assistants API-ju?
Polje s uputama asistentu ima maksimalnu duljinu od 256.000 znakova.
Dobivam pogrešku poput „Poslužitelj je naišao na pogrešku tijekom obrade vašeg zahtjeva. Žao nam je zbog toga! Možete ponovno pokušati poslati zahtjev ili nam se obratiti putem našeg centra za pomoć na help.openai.com ako se pogreška nastavi pojavljivati. ” Što da učinim?
Ako dobivate ovu pogrešku, to može značiti da vaš upit nije ispravno postavljen. Ako stalno ponavljate zahtjev i on ne uspijeva, pokušajte sljedeće:
pobrinite se da preoblikujete svoj upit tako da sve naredbe nalik funkcijama tretira kao funkcije
dodajte sve naredbe u svom upitu kao funkciju u
tools
Zašto moj alat File Search ne radi dobro?
Pri upotrebi alata File Search preporučujemo da max_prompt_tokens postavite na najmanje 20.000. Za dulje razgovore ili više interakcija s File Searchom razmotrite povećanje tog ograničenja na 50.000 ili, idealno, potpuno uklanjanje ograničenja max_prompt_tokens kako biste dobili najkvalitetnije rezultate. Pročitajte više ovdje.
Kako mogu poslati povratne informacije?
Voljeli bismo čuti vaše povratne informacije na našem Forumu za razvojne programere, putem Centra za pomoć na help.openai.com ili na Twitteru @OpenAIDevs.
