OpenAI
Această pagină a fost tradusă automat. Vezi articolul original în limba engleză.

Întrebări frecvente despre Assistants API (v2)

Actualizat: 11 hours ago

Începând cu 11 martie 2025, am lansat componentele de bază ale noii noastre platforme Agents. Pentru detalii, consultați documentația noastră API pentru Responses API, Tools, inclusiv Web Search, File Search și Computer Use, precum și Agents SDK cu Tracing. Pe baza feedbackului dvs. pentru versiunea beta a Assistants API, am integrat îmbunătățiri cheie în Responses API. După ce vom atinge paritatea completă a funcționalităților, vom anunța un plan de retragere a Assistants API mai târziu în acest an, cu o dată-țintă de oprire în prima jumătate a anului 2026.

Ce este Assistants API?

Assistants API le permite dezvoltatorilor să creeze ușor asistenți AI puternici în aplicațiile lor. Acest API elimină nevoia de a gestiona istoricul conversațiilor și adaugă acces la instrumente găzduite de OpenAI, precum Interpretor de coduri și File Search. API-ul acceptă, de asemenea, apelarea funcțiilor îmbunătățită pentru instrumente terțe.

Mai pot folosi versiunea beta Assistants API v1?

Nu. Începând cu 18 decembrie 2024, utilizatorii nu mai au acces la versiunea v1 a versiunii beta Assistant API. În prezent, acceptăm doar v2. Consultați acest ghid de migrare pentru a converti apelurile API din v1 în v2

Cum îl accesez?

Assistants API este disponibil pentru oricine are un cont OpenAI API. De asemenea, puteți începe prin Assistants Playground.

Ce este un Assistant?

Un assistant reprezintă un AI creat pentru un scop specific, care folosește modelele OpenAI și poate accesa fișiere, menține thread-uri persistente și apela instrumente.

Ce este un Thread?

Un thread este o sesiune de conversație între un assistant și un utilizator. Thread-urile simplifică dezvoltarea aplicațiilor prin stocarea istoricului mesajelor și trunchierea acestuia când conversația devine prea lungă pentru lungimea de context a modelului.

Ce este instrumentul File Search?

Instrumentul file_search implementează implicit mai multe bune practici de recuperare pentru a vă ajuta să extrageți datele potrivite din fișierele dvs. pentru a îmbunătăți răspunsurile modelului. Pentru mai multe informații, citiți documentația pentru dezvoltatori.

În mod implicit, instrumentul file_search folosește următoarele setări:

  • Dimensiunea fragmentului: 800 de tokeni

  • Suprapunerea fragmentelor: 400 de tokeni

  • Model de embedding: text-embedding-3-large la 256 de dimensiuni

  • Numărul maxim de fragmente adăugate în context: 20

Care sunt restricțiile pentru încărcarea fișierelor?

Restricțiile pentru încărcarea unui fișier sunt:

  • 512 MB per fișier

  • 5M tokeni per fișier

  • 10k fișiere per vector store

  • 1 vector store per assistant

  • 1 vector store per thread

Limita totală de stocare pentru fiecare proiect dintr-o organizație este de 100 GB.

Care sunt limitările instrumentului File Search?

Avem câteva limitări cunoscute la care lucrăm pentru a adăuga suport în lunile următoare:

  1. În prezent, nu există nicio modalitate de a modifica setările de fragmentare, embedding sau recuperare.

  2. Nu acceptăm analizarea imaginilor din documente.

  3. Nu acceptăm recuperarea din formate de fișiere structurate (precum fișierele .csv sau .jsonl). Vedeți tipurile de fișiere acceptate.

Care sunt limitele de rată pentru Assistants API?

Limitele de rată pentru Assistants API nu sunt legate de nivelul de utilizare și model. În schimb, există limite implicite în funcție de tipul cererii, cu câteva excepții:

  • GET: 1000 RPM

  • POST: 300 RPM

    • POST la /v1/threads/<thread_id>/runs: 200 RPM

    • POST la /v1/threads/runs: 200 RPM

  • DELETE: 300 cereri pe minut

Cum este tarifat Interpretor de coduri în API?

Interpretor de coduri costă 0,03 USD / sesiune. Dacă assistantul dvs. apelează Interpretor de coduri simultan în două thread-uri diferite, acest lucru va crea două sesiuni Interpretor de coduri (2 * 0,03 USD). Fiecare sesiune este activă în mod implicit timp de o oră, ceea ce înseamnă că veți plăti această taxă o singură dată dacă utilizatorul dvs. continuă să dea instrucțiuni către Interpretor de coduri în același thread timp de până la o oră.

Cum este tarifat File Search în API?

File Search costă 0,10 USD/GB de stocare vector store pe zi (primul GB de stocare este gratuit). Dimensiunea vector store se bazează pe dimensiunea rezultată a vector store după ce fișierul dvs. este analizat, fragmentat și transformat în embedding-uri.

Orice vector store creat înainte de 17 aprilie 2024 va fi gratuit până la sfârșitul anului 2024, după care va fi fie:

  • Facturat la tarifele actuale (în prezent 0,10 USD/GB/zi) dacă a fost utilizat cel puțin o dată într-un Run creat după 17 aprilie 2024.

  • Șters dacă nu a fost utilizat într-un singur Run între 17 aprilie 2024 și 31 decembrie 2024 — aceasta pentru a evita să fiți facturat pentru vector store-uri pe care este posibil să le fi creat înainte ca această modificare de preț să fie anunțată, dar pe care nu le-ați folosit niciodată.

Există o limită pentru câți asistenți pot crea?

Nu există nicio limită pentru numărul de asistenți pe care o organizație îi poate crea.

Este disponibil streaming în API?

Da, streamingul este disponibil în Assistants API.

Este disponibil modul JSON în Assistants API?

Da, modul JSON este disponibil în Assistants API prin parametrul response_format din obiectele Assistants sau Run.

Va gestiona Assistants API și cererile pentru apeluri de funcții terțe?

Nu. Deși apelarea funcțiilor permite modelului să selecteze instrumente și să formateze cereri pentru acestea, executarea apelurilor către instrumente terțe nu este gestionată de OpenAI.

Cum sunt gestionate datele pe care le trimit către OpenAI?

Ca și în restul platformei noastre, datele și fișierele transmise către OpenAI API nu sunt niciodată folosite pentru antrenarea modelelor noastre și vă puteți șterge datele oricând aveți nevoie. Datele încărcate în Assistants API sunt stocate pe termen nelimitat până când un utilizator le șterge manual.

Este DALL-E disponibil prin Assistants API?

În acest moment, DALL-E nu este disponibil.

Există o interfață UI pentru Assistants API?

Puteți consulta Playground pentru Assistants API. Asigurați-vă că sunteți în vizualizarea Assistants din bara laterală din stânga și că folosiți un model compatibil cu Tools pe care doriți să le activați.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

Care este limita de caractere pentru instrucțiunile assistantului în Assistants API?

Instrucțiunile de sistem pe care le folosește assistantul au o lungime maximă de 256.000 de caractere.

Primesc o eroare precum „Serverul a întâmpinat o eroare în timpul procesării cererii dvs. Ne cerem scuze pentru asta! Puteți reîncerca cererea sau ne puteți contacta prin help.openai.com dacă eroarea persistă.“ Ce ar trebui să fac?

Dacă primiți această eroare, s-ar putea să însemne că solicitarea dvs. nu este configurată corect. Dacă continuați să reîncercați cererea și aceasta eșuează, iată câteva lucruri pe care să le încercați:

  1. asigurați-vă că vă restructurați solicitarea astfel încât orice comenzi asemănătoare funcțiilor să fie tratate ca funcții

  2. adăugați orice comenzi din solicitare ca funcție în tools

De ce nu funcționează bine instrumentul meu File Search?

Când utilizați instrumentul File Search, recomandăm să setați max_prompt_tokens la nu mai puțin de 20.000. Pentru conversații mai lungi sau interacțiuni multiple cu File Search, luați în considerare creșterea acestei limite la 50.000 sau, ideal, eliminarea completă a limitelor max_prompt_tokens pentru a obține rezultate de cea mai înaltă calitate. Citiți mai multe aici.

Cum pot oferi feedback?

Ne-ar plăcea să primim feedbackul dvs. pe Developer Forum, prin Centrul de asistență la help.openai.com sau pe Twitter @OpenAIDevs.

A fost util acest articol?