Întrebări frecvente despre Assistants API (v2)

Începând cu 11 martie 2025, am lansat componentele de bază ale noii noastre platforme Agents. Pentru detalii, consultă documentația noastră API pentru Responses API, instrumente precum Web Search, File Search și Computer Use, precum și Agents SDK cu Tracing. Pe baza feedbackului tău pentru Assistants API beta, am integrat îmbunătățiri cheie în Responses API. După ce vom atinge paritatea completă a funcționalităților, vom anunța un plan de perimare pentru Assistants API mai târziu în acest an, cu o dată țintă de retragere în prima jumătate a anului 2026.

Ce este Assistants API?

Assistants API le permite dezvoltatorilor să creeze ușor asistenți AI puternici în aplicațiile lor. Acest API elimină necesitatea de a gestiona istoricul conversațiilor și adaugă acces la instrumente găzduite de OpenAI, precum Interpretor de coduri și File Search. API-ul acceptă, de asemenea, apelarea funcțiilor îmbunătățită pentru instrumente terțe.

Mai pot folosi Assistants API v1 beta?

Nu. Începând cu 18 decembrie 2024, utilizatorii nu mai au acces la versiunea v1 a Assistant API beta. În prezent acceptăm doar v2. Te rugăm să consulți acest ghid de migrare pentru a converti apelurile tale API de la v1 la v2

Cum îl accesez?

Assistants API este disponibil pentru oricine are un cont OpenAI API, dar este perimat și va fi eliminat în august 2026. Pentru proiecte noi, folosește în schimb Responses API. Dacă folosești deja Assistants API, planifică migrarea la Responses API. Poți accesa în continuare asistenții existenți în Assistants Playground cât timp API-ul rămâne disponibil.

Ce este un asistent?

Un asistent reprezintă o AI construită pentru un anumit scop, care folosește modelele OpenAI și poate accesa fișiere, menține fire persistente și apela instrumente.

Ce este un fir?

Un fir este o sesiune de conversație între un asistent și un utilizator. Firele simplifică dezvoltarea aplicațiilor prin stocarea istoricului mesajelor și trunchierea acestuia atunci când conversația devine prea lungă pentru lungimea contextului modelului.

Ce este instrumentul File Search?

Instrumentul `file_search` implementează implicit mai multe bune practici de recuperare pentru a te ajuta să extragi datele potrivite din fișierele tale, ca să îmbunătățești răspunsurile modelului. Pentru mai multe informații, te rugăm să citești documentația noastră pentru dezvoltatori.

În mod implicit, instrumentul file_search folosește următoarele setări:

Dimensiunea fragmentului: 800 de tokeni
Suprapunerea fragmentelor: 400 de tokeni
Model de embedding: `text-embedding-3-large` la 256 de dimensiuni
Numărul maxim de fragmente adăugate în context: 20

Care sunt restricțiile pentru încărcarea fișierelor?

Restricțiile pentru încărcarea unui fișier sunt:

512 MB per fișier
5M tokeni per fișier
10k fișiere per depozit vectorial
1 depozit vectorial per asistent
1 depozit vectorial per fir

Limita totală de stocare pentru fiecare proiect dintr-o organizație este de 100 GB.

Care sunt limitările instrumentului File Search?

Avem câteva limitări cunoscute pentru care lucrăm să adăugăm suport în lunile următoare:

În prezent, nu există nicio modalitate de a modifica setările de fragmentare, embedding sau recuperare.
Nu acceptăm analizarea imaginilor din documente.
Nu acceptăm recuperări din formate de fișiere structurate (precum fișiere .csv sau .jsonl). Vezi tipurile de fișiere acceptate.

Care sunt limitele de rată pentru Assistants API?

Limitele de rată pentru Assistants API nu sunt legate de nivelul de utilizare și model. În schimb, există limite implicite în funcție de tipul de solicitare, cu câteva excepții:

GET: 1000 RPM
POST: 300 RPM

DELETE: 300 de solicitări pe minut

Cum este tarifat Interpretor de coduri în API?

Interpretor de coduri este tarifat la 0,03 USD/sesiune. Dacă asistentul tău apelează Interpretor de coduri simultan în două fire diferite, acest lucru ar crea două sesiuni Interpretor de coduri (2 * 0,03 USD). Fiecare sesiune este activă în mod implicit timp de o oră, ceea ce înseamnă că ai plăti această taxă o singură dată dacă utilizatorul continuă să ofere instrucțiuni către Interpretor de coduri în același fir timp de până la o oră.

Cum este tarifat File Search în API?

File Search este tarifat la 0,10 USD/GB de stocare în depozitul vectorial pe zi (primul GB de stocare este gratuit). Dimensiunea depozitului vectorial se bazează pe dimensiunea rezultată a depozitului vectorial după ce fișierul tău este analizat, fragmentat și transformat în embeddinguri.

Orice depozite vectoriale create înainte de 17 aprilie 2024 vor fi gratuite până la sfârșitul anului 2024, după care vor fi fie:

Facturate la tarifele curente (în prezent 0,10 USD/GB/zi) dacă au fost utilizate cel puțin o dată într-un Run creat după 17 aprilie 2024.
Șterse dacă nu au fost utilizate într-un singur Run între 17 aprilie 2024 și 31 decembrie 2024 — acest lucru este pentru a evita să fii facturat pentru depozite vectoriale pe care poate le-ai creat înainte ca această modificare de tarifare să fie anunțată, dar nu le-ai folosit niciodată.

Există o limită pentru câți asistenți pot crea?

Nu există nicio limită pentru câți asistenți poate crea o organizație.

Este streamingul disponibil în API?

Da, streamingul este disponibil în Assistants API.

Este modul JSON disponibil în Assistants API?

Da, modul JSON este disponibil în Assistants API prin parametrul response_format pe obiectele Assistants sau Run.

Assistants API va gestiona și solicitările pentru apeluri de funcții terțe?

Nu. Deși apelarea funcțiilor permite modelului să selecteze instrumente și să formateze solicitări pentru acestea, executarea apelurilor către instrumente terțe nu este gestionată de OpenAI.

Cum sunt gestionate datele pe care le trimit către OpenAI?

Ca și în restul platformei noastre, datele și fișierele transmise către OpenAI API nu sunt folosite niciodată pentru a ne antrena modelele și îți poți șterge datele ori de câte ori ai nevoie. Datele încărcate în Assistants API sunt stocate pe termen nelimitat până când un utilizator le șterge manual.

Este DALL-E disponibil prin Assistants API?

În acest moment, DALL-E nu este disponibil.

Există o interfață UI pentru Assistants API?

Poți consulta Playground pentru Assistants API. Asigură-te că ești în vizualizarea Assistants din bara laterală stângă și că folosești un model compatibil cu instrumentele pe care dorești să le activezi.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

Care este limita de caractere pentru instrucțiunile asistentului în Assistants API?

Câmpul de instrucțiuni ale asistentului are o lungime maximă de 256.000 de caractere.

Primesc o eroare precum „Serverul a întâmpinat o eroare la procesarea solicitării tale. Ne pare rău pentru asta! Poți reîncerca solicitarea sau ne poți contacta prin Centrul de asistență la help.openai.com dacă eroarea persistă. ” Ce ar trebui să fac?

Dacă primești această eroare, ar putea însemna că solicitarea ta nu este configurată corect. Dacă reîncerci în continuare solicitarea și aceasta eșuează, iată câteva lucruri de încercat:

asigură-te că restructurezi solicitarea pentru a trata orice comenzi asemănătoare funcțiilor ca funcții
adaugă orice comenzi din solicitarea ta ca funcție în tools

De ce instrumentul meu File Search nu funcționează bine?

Când folosești instrumentul File Search, recomandăm să setezi max_prompt_tokens la cel puțin 20.000. Pentru conversații mai lungi sau interacțiuni multiple cu File Search, ia în considerare creșterea acestei limite la 50.000 sau, ideal, eliminarea completă a limitelor max_prompt_tokens pentru a obține rezultate de cea mai înaltă calitate. Citește mai multe aici.

Cum pot oferi feedback?

Ne-ar plăcea să primim feedbackul tău pe Forumul pentru dezvoltatori, prin Centrul de asistență la help.openai.com sau pe Twitter @OpenAIDevs.