FAQ dotyczące Assistants API (v2)

11 marca 2025 r. udostępniliśmy elementy składowe naszej nowej platformy Agents. Szczegóły znajdziesz w naszej dokumentacji API dotyczącej Responses API, narzędzi, w tym Web Search, File Search i Computer Use, oraz naszego Agents SDK z funkcją Tracing. Na podstawie Waszych opinii o wersji beta Assistants API wprowadziliśmy kluczowe ulepszenia do Responses API. Po osiągnięciu pełnej zgodności funkcji ogłosimy plan wycofania Assistants API w dalszej części tego roku, z docelową datą zakończenia w pierwszej połowie 2026 r.

Czym jest Assistants API?

Assistants API umożliwia deweloperom łatwe tworzenie zaawansowanych asystentów AI w ich aplikacjach. To API eliminuje potrzebę zarządzania historią rozmowy i dodaje dostęp do narzędzi hostowanych przez OpenAI, takich jak Interpreter kodu i File Search. API obsługuje także ulepszone wywołanie funkcji dla narzędzi innych firm.

Czy nadal mogę używać Assistants API v1 beta?

Nie. Od 18 grudnia 2024 r. użytkownicy nie mają już dostępu do wersji v1 beta Assistant API. Obecnie obsługujemy tylko v2. Zapoznaj się z tym przewodnikiem migracji, aby przekształcić wywołania API z v1 na v2

Jak uzyskać do niego dostęp?

Assistants API jest dostępne dla każdego, kto ma konto OpenAI API, ale jest przestarzałe i zostanie usunięte w sierpniu 2026 r. W nowych projektach używaj zamiast niego Responses API. Jeśli już używasz Assistants API, zaplanuj migrację do Responses API. Nadal możesz uzyskiwać dostęp do istniejących asystentów w środowisku Assistants Playground, dopóki API pozostaje dostępne.

Czym jest asystent?

Asystent reprezentuje specjalnie zbudowaną AI, która używa modeli OpenAI i może uzyskiwać dostęp do plików, utrzymywać trwałe wątki oraz wywoływać narzędzia.

Czym jest wątek?

Wątek to sesja rozmowy między asystentem a użytkownikiem. Wątki upraszczają tworzenie aplikacji, przechowując historię wiadomości i skracając ją, gdy rozmowa staje się zbyt długa dla długości kontekstu modelu.

Czym jest narzędzie File Search?

Narzędzie `file_search` wdraża od razu kilka najlepszych praktyk pobierania danych, aby pomóc Ci wyodrębniać właściwe dane z plików i wzbogacać odpowiedzi modelu. Aby uzyskać więcej informacji, przeczytaj naszą dokumentację dla deweloperów.

Domyślnie narzędzie file_search używa następujących ustawień:

Rozmiar fragmentu: 800 tokenów
Nakładanie się fragmentów: 400 tokenów
Model osadzania: `text-embedding-3-large` przy 256 wymiarach
Maksymalna liczba fragmentów dodanych do kontekstu: 20

Jakie są ograniczenia dotyczące przesyłania plików?

Ograniczenia dotyczące przesyłania pliku są następujące:

512 MB na plik
5 mln tokenów na plik
10 tys. plików na magazyn wektorowy
1 magazyn wektorowy na asystenta
1 magazyn wektorowy na wątek

Ogólny limit miejsca na dane dla każdego projektu w organizacji wynosi 100 GB.

Jakie są ograniczenia narzędzia File Search?

Mamy kilka znanych ograniczeń, nad których obsługą pracujemy w nadchodzących miesiącach:

Obecnie nie ma możliwości modyfikowania ustawień dzielenia na fragmenty, osadzania ani pobierania.
Nie obsługujemy analizowania obrazów w dokumentach.
Nie obsługujemy pobierania danych ze strukturyzowanych formatów plików (takich jak pliki .csv lub .jsonl). Zobacz obsługiwane typy plików.

Jakie są limity zapytań dla Assistants API?

Limity zapytań dla Assistants API nie są powiązane z poziomem użycia i modelem. Zamiast tego obowiązują domyślne limity według typu żądania, z kilkoma wyjątkami:

GET: 1000 RPM
POST: 300 RPM

DELETE: 300 żądań na minutę

Jak wyceniany jest Interpreter kodu w API?

Interpreter kodu kosztuje 0,03 USD za sesję. Jeśli Twój asystent wywoła Interpreter kodu jednocześnie w dwóch różnych wątkach, utworzy to dwie sesje Interpretera kodu (2 * 0,03 USD). Każda sesja jest domyślnie aktywna przez jedną godzinę, co oznacza, że zapłacisz tę opłatę tylko raz, jeśli użytkownik będzie przekazywać instrukcje do Interpretera kodu w tym samym wątku przez maksymalnie godzinę.

Jak wyceniane jest File Search w API?

File Search kosztuje 0,10 USD/GB miejsca w magazynie wektorowym dziennie (pierwszy GB miejsca jest bezpłatny). Rozmiar magazynu wektorowego zależy od wynikowego rozmiaru magazynu wektorowego po przeanalizowaniu, podzieleniu na fragmenty i osadzeniu pliku.

Wszystkie magazyny wektorowe utworzone przed 17 kwietnia 2024 r. będą bezpłatne do końca 2024 r., po czym zostaną:

Rozliczone według bieżących stawek (obecnie 0,10 USD/GB/dzień), jeśli zostały użyte co najmniej raz w uruchomieniu Run utworzonym po 17 kwietnia 2024 r.
Usunięte, jeśli nie zostały użyte w żadnym uruchomieniu Run między 17 kwietnia 2024 r. a 31 grudnia 2024 r. — ma to zapobiec naliczeniu opłat za magazyny wektorowe, które mogły zostać utworzone przed ogłoszeniem tej zmiany cen, ale nigdy nie były używane.

Czy istnieje limit liczby asystentów, których mogę utworzyć?

Nie ma limitu liczby asystentów, których może utworzyć organizacja.

Czy streaming jest dostępny w API?

Tak, streaming jest dostępny w Assistants API.

Czy tryb JSON jest dostępny w Assistants API?

Tak, tryb JSON jest dostępny w Assistants API za pośrednictwem parametru response_format w obiektach Assistants lub Run.

Czy Assistants API będzie również zarządzać żądaniami wywołań funkcji innych firm?

Nie. Chociaż wywołanie funkcji umożliwia modelowi wybieranie narzędzi i formatowanie żądań do nich, wykonywanie wywołań narzędzi innych firm nie jest zarządzane przez OpenAI.

Jak traktowane są dane, które wysyłam do OpenAI?

Podobnie jak w pozostałej części naszej platformy, dane i pliki przekazywane do OpenAI API nigdy nie są używane do trenowania naszych modeli i możesz usunąć swoje dane zawsze, gdy tego potrzebujesz. Dane przesłane do Assistants API są przechowywane bezterminowo, dopóki użytkownik nie usunie ich ręcznie.

Czy DALL-E jest dostępny przez Assistants API?

Obecnie DALL-E nie jest dostępny.

Czy istnieje interfejs użytkownika dla Assistants API?

Możesz sprawdzić środowisko Playground dla Assistants API. Upewnij się, że jesteś w widoku Assistants na lewym pasku bocznym i używasz modelu zgodnego z narzędziami, które chcesz włączyć.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

Jaki jest limit znaków dla instrukcji asystenta w Assistants API?

Pole instrukcji asystenta ma maksymalną długość 256 000 znaków.

Otrzymuję błąd, np. „Podczas przetwarzania Twojego żądania wystąpił błąd serwera. Przepraszamy za to! Możesz ponowić żądanie lub skontaktować się z nami przez nasze Centrum pomocy pod adresem help.openai.com, jeśli błąd będzie się powtarzał. ” Co mam zrobić?

Jeśli otrzymujesz ten błąd, może to oznaczać, że Twoje polecenie nie jest poprawnie skonfigurowane. Jeśli nadal ponawiasz żądanie i kończy się ono niepowodzeniem, spróbuj wykonać następujące czynności:

upewnij się, że przekształcasz swoje polecenie tak, aby traktować wszelkie polecenia przypominające funkcje jako funkcje
dodaj wszelkie polecenia w swoim poleceniu jako funkcję do tools

Dlaczego moje narzędzie File Search nie działa dobrze?

Podczas korzystania z narzędzia File Search zalecamy ustawienie max_prompt_tokens na co najmniej 20 000. W przypadku dłuższych rozmów lub wielu interakcji z File Search rozważ zwiększenie tego limitu do 50 000 albo, najlepiej, całkowite usunięcie limitów max_prompt_tokens, aby uzyskać wyniki najwyższej jakości. Przeczytaj więcej tutaj.

Jak mogę przekazać opinię?

Chętnie poznamy Twoją opinię na naszym Forum deweloperów, za pośrednictwem Centrum pomocy pod adresem help.openai.com lub na Twitterze @OpenAIDevs.