OpenAI
Tato stránka byla přeložena strojově. Zobrazit původní článek v angličtině.

Časté dotazy k Assistants API (v2)

Aktualizováno: 5 hours ago

K 11. březnu 2025 jsme vydali stavební prvky naší nové platformy Agents. Podrobnosti najdete v naší API dokumentaci k Responses API, nástrojům včetně Web Search, File Search a Computer Use a k našemu Agents SDK s funkcí Tracing. Na základě vaší zpětné vazby k beta verzi Assistants API jsme do Responses API zapracovali klíčová vylepšení. Jakmile dosáhneme plné funkční parity, oznámíme ještě letos plán ukončení Assistants API s cílovým datem ukončení provozu v první polovině roku 2026.

Co je Assistants API?

Assistants API umožňuje vývojářům snadno vytvářet ve svých aplikacích výkonné AI asistenty. Toto API odstraňuje nutnost spravovat historii konverzace a přidává přístup k nástrojům hostovaným OpenAI, jako jsou interpret kódu a File Search. API také podporuje vylepšené volání funkce pro nástroje třetích stran.

Mohu stále používat beta verzi Assistants API v1?

Ne. Od 18. prosince 2024 už uživatelé nemají přístup k beta verzi v1 Assistant API. V současnosti podporujeme pouze v2. Podívejte se prosím na tohoto průvodce migrací, který vám pomůže převést vaše API volání z v1 na v2

Jak k němu získám přístup?

Assistants API je k dispozici každému, kdo má účet OpenAI API. Začít můžete také přes Assistants Playground.

Co je Assistant?

Assistant představuje účelově vytvořenou AI, která používá modely OpenAI a může přistupovat k souborům, udržovat perzistentní vlákna a volat nástroje.

Co je Thread?

Thread je relace konverzace mezi asistentem a uživatelem. Vlákna zjednodušují vývoj aplikací tím, že ukládají historii zpráv a zkracují ji, když je konverzace pro délku kontextu modelu příliš dlouhá.

Co je nástroj File Search?

Nástroj file_search implementuje několik osvědčených postupů pro vyhledávání hned po vybalení, aby vám pomohl získat ze souborů správná data pro rozšíření odpovědí modelu. Další informace najdete v naší dokumentaci pro vývojáře.

Ve výchozím nastavení používá nástroj file_search následující nastavení:

  • Velikost chunku: 800 tokenů

  • Překryv chunků: 400 tokenů

  • Embedding model: text-embedding-3-large s 256 dimenzemi

  • Maximální počet chunků přidaných do kontextu: 20

Jaká jsou omezení pro nahrávání souborů?

Omezení pro nahrávání souboru jsou následující:

  • 512 MB na soubor

  • 5M tokenů na soubor

  • 10k souborů na vector store

  • 1 vector store na assistant

  • 1 vector store na thread

Celkový limit úložiště pro každý projekt v organizaci je 100 GB.

Jaká jsou omezení nástroje File Search?

Máme několik známých omezení, na jejichž podpoře v nadcházejících měsících pracujeme:

  1. Momentálně neexistuje způsob, jak upravit nastavení chunkingu, embeddingu nebo vyhledávání.

  2. Nepodporujeme parsování obrázků v dokumentech.

  3. Nepodporujeme vyhledávání nad strukturovanými formáty souborů (například soubory .csv nebo .jsonl). Viz podporované typy souborů.

Jaké jsou limity rychlosti pro Assistants API?

Limity rychlosti pro Assistants API nejsou vázané na úroveň využití a model. Místo toho existují výchozí limity podle typu požadavku, s několika výjimkami:

  • GET: 1000 RPM

  • POST: 300 RPM

    • POST na /v1/threads/<thread_id>/runs: 200 RPM

    • POST na /v1/threads/runs: 200 RPM

  • DELETE: 300 požadavků za minutu

Jak se v API účtuje interpret kódu?

Interpret kódu se účtuje za $0.03 / relaci. Pokud váš assistant zavolá interpret kódu současně ve dvou různých vláknech, vytvoří to dvě relace interpretu kódu (2 * $0.03). Každá relace je ve výchozím nastavení aktivní jednu hodinu, což znamená, že tento poplatek zaplatíte pouze jednou, pokud bude váš uživatel zadávat instrukce interpretu kódu ve stejném threadu po dobu až jedné hodiny.

Jak se v API účtuje File Search?

File Search se účtuje ve výši $0.10/GB za den za úložiště vector store (první GB úložiště je zdarma). Velikost vector store vychází z výsledné velikosti vector store poté, co je váš soubor zparsován, rozdělen na chunky a převeden na embeddingy.

Všechny vector store vytvořené před 17. dubnem 2024 budou zdarma do konce roku 2024, poté budou buď:

  • Účtovány podle aktuálních sazeb (aktuálně $0.10/GB/den), pokud byly alespoň jednou použity v Run vytvořeném po 17. dubnu 2024.

  • Smazány, pokud nebyly použity ani v jednom Run mezi 17. dubnem 2024 a 31. prosincem 2024 — aby se zabránilo účtování za vector store, které jste možná vytvořili před oznámením této změny cen, ale nikdy nepoužili.

Existuje limit, kolik asistentů mohu vytvořit?

Počet asistentů, které může organizace vytvořit, není omezen.

Je v API k dispozici streaming?

Ano, streaming je v Assistants API k dispozici.

Je v Assistants API k dispozici režim JSON?

Ano, režim JSON je v Assistants API k dispozici prostřednictvím parametru response_format u objektů Assistants nebo Run.

Bude Assistants API také spravovat požadavky na volání funkcí třetích stran?

Ne. Přestože volání funkce umožňuje modelu vybírat nástroje a formátovat pro ně požadavky, provádění volání nástrojů třetích stran OpenAI nespravuje.

Jak je nakládáno s daty, která posílám do OpenAI?

Stejně jako na zbytku naší platformy se data a soubory předané do OpenAI API nikdy nepoužívají k trénování našich modelů a svá data můžete kdykoli smazat. Data nahraná do Assistants API se ukládají na neomezenou dobu, dokud je uživatel ručně nesmaže.

Je DALL-E dostupný přes Assistants API?

V tuto chvíli DALL-E není k dispozici.

Existuje pro Assistants API nějaké UI?

Můžete se podívat na Playground pro Assistants API. Ujistěte se, že jste v levém postranním panelu v zobrazení Assistants a používáte model kompatibilní s nástroji, které chcete zapnout.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

Jaký je limit počtu znaků pro instrukce assistantu v Assistants API?

Systémové instrukce, které assistant používá, mají maximální délku 256 000 znaků.

Zobrazuje se mi chyba jako „Při zpracování vašeho požadavku došlo na serveru k chybě. Omlouváme se! Požadavek můžete zkusit znovu nebo nás kontaktovat prostřednictvím našeho Centra nápovědy na adrese help.openai.com, pokud chyba přetrvává.“ Co mám dělat?

Pokud se vám zobrazuje tato chyba, může to znamenat, že váš prompt není nastaven správně. Pokud požadavek zkoušíte opakovaně a stále selhává, zkuste následující:

  1. ujistěte se, že svůj prompt přepracujete tak, aby se se všemi příkazy podobnými funkcím zacházelo jako s funkcemi

  2. přidejte všechny příkazy ve svém promptu jako funkci do tools

Proč můj nástroj File Search nefunguje dobře?

Při používání nástroje File Search doporučujeme nastavit max_prompt_tokens minimálně na 20 000. U delších konverzací nebo více interakcí s File Search zvažte zvýšení tohoto limitu na 50 000, nebo ideálně úplné odstranění limitů max_prompt_tokens, abyste získali co nejkvalitnější výsledky. Více si přečtěte zde.

Jak mohu poskytnout zpětnou vazbu?

Budeme rádi za vaši zpětnou vazbu na našem fóru pro vývojáře, přes Centrum nápovědy na adrese help.openai.com nebo na Twitteru @OpenAIDevs.

Byl tento článek užitečný?