OpenAI
Ta strona została przetłumaczona maszynowo. Wyświetl oryginalny artykuł w języku angielskim.

FAQ dotyczące Assistants API (v2)

Zaktualizowano: 2 days ago

Od 11 marca 2025 r. udostępniliśmy podstawowe elementy naszej nowej platformy Agents. Szczegóły znajdziesz w naszej dokumentacji API dotyczącej Responses API, narzędzi, w tym Web Search, File Search i Computer Use, a także naszego Agents SDK z funkcją Tracing. Na podstawie opinii o wersji beta Assistants API wprowadziliśmy kluczowe ulepszenia do Responses API. Gdy osiągniemy pełną zgodność funkcji, ogłosimy plan wycofania Assistants API jeszcze w tym roku, a docelowa data zakończenia działania przypada na pierwszą połowę 2026 roku.

Czym jest Assistants API?

Assistants API umożliwia deweloperom łatwe tworzenie zaawansowanych asystentów AI w swoich aplikacjach. To API eliminuje konieczność zarządzania historią rozmowy i dodaje dostęp do narzędzi hostowanych przez OpenAI, takich jak Interpreter kodu i File Search. API obsługuje także ulepszone wywołanie funkcji dla narzędzi zewnętrznych.

Czy nadal mogę korzystać z Assistants API v1 beta?

Nie. Od 18 grudnia 2024 r. użytkownicy nie mają już dostępu do wersji v1 beta Assistant API. Obecnie obsługujemy tylko v2. Zapoznaj się z tym przewodnikiem migracji, aby przekonwertować wywołania API z v1 na v2

Jak uzyskać dostęp?

Assistants API jest dostępne dla każdego, kto ma konto OpenAI API. Możesz też zacząć od środowiska Playground dla Assistants.

Czym jest Assistant?

Assistant to wyspecjalizowana AI, która korzysta z modeli OpenAI i może uzyskiwać dostęp do plików, utrzymywać trwałe wątki oraz wywoływać narzędzia.

Czym jest Thread?

Thread to sesja rozmowy między asystentem a użytkownikiem. Thready upraszczają tworzenie aplikacji, przechowując historię wiadomości i skracając ją, gdy rozmowa staje się zbyt długa dla długości kontekstu modelu.

Czym jest narzędzie File Search?

Narzędzie file_search wdraża od razu kilka sprawdzonych praktyk wyszukiwania, aby pomóc Ci wyodrębnić właściwe dane z plików i wzbogacić odpowiedzi modelu. Więcej informacji znajdziesz w naszej dokumentacji dla deweloperów.

Domyślnie narzędzie file_search używa następujących ustawień:

  • Rozmiar chunku: 800 tokenów

  • Nakładanie chunków: 400 tokenów

  • Model embeddingów: text-embedding-3-large o 256 wymiarach

  • Maksymalna liczba chunków dodanych do kontekstu: 20

Jakie są ograniczenia przesyłania plików?

Ograniczenia dotyczące przesyłania pliku są następujące:

  • 512 MB na plik

  • 5 mln tokenów na plik

  • 10 tys. plików na vector store

  • 1 vector store na assistant

  • 1 vector store na thread

Łączny limit pamięci dla każdego projektu w organizacji wynosi 100 GB.

Jakie są ograniczenia narzędzia File Search?

Mamy kilka znanych ograniczeń, nad których obsługą pracujemy w najbliższych miesiącach:

  1. Obecnie nie ma możliwości modyfikacji ustawień chunkingu, embeddingów ani wyszukiwania.

  2. Nie obsługujemy analizowania obrazów w dokumentach.

  3. Nie obsługujemy wyszukiwania w ustrukturyzowanych formatach plików (takich jak pliki .csv lub .jsonl). Zobacz obsługiwane typy plików.

Jakie są limity szybkości dla Assistants API?

Limity szybkości dla Assistants API nie są powiązane z poziomem użycia i modelem. Zamiast tego obowiązują limity domyślne według typu żądania, z kilkoma wyjątkami:

  • GET: 1000 RPM

  • POST: 300 RPM

    • POST do /v1/threads/<thread_id>/runs: 200 RPM

    • POST do /v1/threads/runs: 200 RPM

  • DELETE: 300 żądań na minutę

Jak wyceniany jest Interpreter kodu w API?

Interpreter kodu kosztuje 0,03 USD za sesję. Jeśli Twój assistant wywoła Interpreter kodu jednocześnie w dwóch różnych threadach, spowoduje to utworzenie dwóch sesji Interpretera kodu (2 * 0,03 USD). Każda sesja jest domyślnie aktywna przez godzinę, co oznacza, że opłata zostanie naliczona tylko raz, jeśli użytkownik będzie nadal przekazywać instrukcje do Interpretera kodu w tym samym threadzie przez maksymalnie godzinę.

Jak wyceniany jest File Search w API?

File Search kosztuje 0,10 USD/GB pamięci vector store dziennie (pierwszy GB pamięci jest bezpłatny). Rozmiar vector store jest określany na podstawie wynikowego rozmiaru po przetworzeniu, pocięciu na chunki i osadzeniu Twojego pliku.

Wszystkie vector stores utworzone przed 17 kwietnia 2024 r. będą bezpłatne do końca 2024 r., po czym zostaną:

  • Rozliczane według bieżących stawek (obecnie 0,10 USD/GB/dzień), jeśli zostały użyte co najmniej raz w Run utworzonym po 17 kwietnia 2024 r.

  • Usunięte, jeśli nie zostały użyte ani razu w żadnym Run między 17 kwietnia 2024 r. a 31 grudnia 2024 r. — ma to zapobiec naliczaniu opłat za vector stores, które mogły zostać utworzone przed ogłoszeniem tej zmiany cen, ale nigdy nie były używane.

Czy istnieje limit liczby assistantów, których mogę utworzyć?

Nie ma limitu liczby assistantów, które organizacja może utworzyć.

Czy streaming jest dostępny w API?

Tak, streaming jest dostępny w Assistants API.

Czy tryb JSON jest dostępny w Assistants API?

Tak, tryb JSON jest dostępny w Assistants API za pośrednictwem parametru response_format w obiektach Assistants lub Run.

Czy Assistants API będzie również zarządzać żądaniami wywołań funkcji narzędzi zewnętrznych?

Nie. Chociaż wywołanie funkcji umożliwia modelowi wybieranie narzędzi i formatowanie żądań dla nich, wykonywanie wywołań narzędzi zewnętrznych nie jest zarządzane przez OpenAI.

Jak traktowane są dane, które wysyłam do OpenAI?

Podobnie jak w przypadku reszty naszej platformy, dane i pliki przekazywane do OpenAI API nigdy nie są używane do trenowania naszych modeli, a swoje dane możesz usunąć w dowolnym momencie. Dane przesłane do Assistants API są przechowywane bezterminowo, dopóki użytkownik ręcznie ich nie usunie.

Czy DALL-E jest dostępne przez Assistants API?

Obecnie DALL-E nie jest dostępne.

Czy istnieje interfejs użytkownika dla Assistants API?

Możesz sprawdzić środowisko Playground dla Assistants API. Upewnij się, że w lewym pasku bocznym jesteś w widoku Assistants i używasz modelu zgodnego z narzędziami, które chcesz włączyć.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

Jaki jest limit znaków dla instrukcji asystenta w Assistants API?

Instrukcje systemowe używane przez assistant mają maksymalną długość 256 000 znaków.

Otrzymuję błąd, taki jak „The server had an error while processing your request. Sorry about that! You can retry your request, or contact us through our help center at help.openai.com if the error persists. “ Co mam zrobić?

Jeśli pojawia się ten błąd, może to oznaczać, że Twoje polecenie nie jest poprawnie skonfigurowane. Jeśli nadal ponawiasz żądanie i kończy się ono niepowodzeniem, oto kilka rzeczy, których warto spróbować:

  1. upewnij się, że przeformułowujesz polecenie tak, aby wszelkie polecenia podobne do funkcji były traktowane jak funkcje

  2. dodaj wszelkie polecenia z polecenia jako funkcję do tools

Dlaczego moje narzędzie File Search nie działa dobrze?

Podczas korzystania z narzędzia File Search zalecamy ustawienie max_prompt_tokens na co najmniej 20 000. W przypadku dłuższych rozmów lub wielu interakcji z File Search rozważ zwiększenie tego limitu do 50 000 albo, najlepiej, całkowite usunięcie limitów max_prompt_tokens, aby uzyskać wyniki najwyższej jakości. Więcej informacji znajdziesz tutaj.

Jak mogę przekazać opinię?

Będzie nam bardzo miło poznać Twoją opinię na naszym Forum deweloperów, przez Centrum pomocy pod adresem help.openai.com lub na Twitterze @OpenAIDevs.

Czy ten artykuł był pomocny?