Časté dotazy k Assistants API (v2)

K 11. březnu 2025 jsme vydali základní stavební bloky naší nové platformy Agents. Podrobnosti najdete v naší dokumentaci API k Responses API, nástrojům včetně Web Search, File Search a Computer Use a k našemu Agents SDK s Tracing. Na základě vaší zpětné vazby k beta verzi Assistants API jsme do Responses API začlenili klíčová vylepšení. Jakmile dosáhneme úplné parity funkcí, oznámíme později v tomto roce plán ukončení podpory Assistants API s cílovým datem vypnutí v první polovině roku 2026.

Co je Assistants API?

Assistants API umožňuje vývojářům snadno vytvářet výkonné AI asistenty ve svých aplikacích. Toto API odstraňuje nutnost spravovat historii konverzací a přidává přístup k nástrojům hostovaným OpenAI, jako je interpret kódu a File Search. API také podporuje vylepšené volání funkce pro nástroje třetích stran.

Mohu stále používat Assistants API v1 beta?

Ne. Od 18. prosince 2024 už uživatelé nemají přístup k verzi v1 beta verze Assistant API. V současnosti podporujeme pouze v2. Podívejte se prosím na tohoto průvodce migrací, kde zjistíte, jak převést volání API z v1 na v2

Jak k němu získám přístup?

Assistants API je dostupné každému s účtem OpenAI API, ale je zastaralé a v srpnu 2026 bude odstraněno. Pro nové projekty místo něj použijte Responses API. Pokud už Assistants API používáte, naplánujte migraci na Responses API. Ke stávajícím asistentům můžete stále přistupovat v Assistants Playground, dokud bude API dostupné.

Co je asistent?

Asistent představuje účelově vytvořenou AI, která používá modely OpenAI a může přistupovat k souborům, udržovat trvalá vlákna a volat nástroje.

Co je vlákno?

Vlákno je konverzační relace mezi asistentem a uživatelem. Vlákna zjednodušují vývoj aplikací tím, že ukládají historii zpráv a zkracují ji, když je konverzace příliš dlouhá pro délku kontextu modelu.

Co je nástroj File Search?

Nástroj `file_search` ve výchozím nastavení implementuje několik osvědčených postupů načítání, které vám pomohou získat ze souborů správná data a rozšířit tak odpovědi modelu. Další informace najdete v naší dokumentaci pro vývojáře.

Ve výchozím nastavení používá nástroj file_search tato nastavení:

Velikost bloku: 800 tokenů
Překryv bloků: 400 tokenů
Model vkládání: `text-embedding-3-large` při 256 dimenzích
Maximální počet bloků přidaných do kontextu: 20

Jaká jsou omezení pro nahrávání souborů?

Omezení pro nahrávání souboru jsou:

512 MB na soubor
5 mil. tokenů na soubor
10 tis. souborů na vektorové úložiště
1 vektorové úložiště na asistenta
1 vektorové úložiště na vlákno

Celkový limit úložiště pro každý projekt v organizaci je 100 GB.

Jaká jsou omezení nástroje File Search?

Máme několik známých omezení, u kterých pracujeme na doplnění podpory v nadcházejících měsících:

Momentálně neexistuje způsob, jak upravit nastavení dělení na bloky, vkládání ani načítání.
Nepodporujeme analýzu obrázků v dokumentech.
Nepodporujeme načítání ze strukturovaných formátů souborů (například souborů .csv nebo .jsonl). Viz podporované typy souborů.

Jaké jsou limity frekvence požadavků pro Assistants API?

Limity frekvence požadavků pro Assistants API nejsou navázány na úroveň využití a model. Místo toho existují výchozí limity podle typu požadavku, s několika výjimkami:

GET: 1000 RPM
POST: 300 RPM

DELETE: 300 požadavků za minutu

Jak je interpret kódu v API naceněn?

Interpret kódu stojí 0,03 USD za relaci. Pokud váš asistent volá interpret kódu současně ve dvou různých vláknech, vytvoří se dvě relace interpretu kódu (2 × 0,03 USD). Každá relace je ve výchozím nastavení aktivní jednu hodinu, což znamená, že tento poplatek zaplatíte jen jednou, pokud váš uživatel bude ve stejném vlákně po dobu až jedné hodiny dál zadávat pokyny interpretu kódu.

Jak je File Search v API naceněn?

File Search stojí 0,10 USD za GB úložiště vektorového úložiště za den (první GB úložiště je zdarma). Velikost vektorového úložiště vychází z výsledné velikosti vektorového úložiště poté, co je váš soubor analyzován, rozdělen na bloky a vložen.

Všechna vektorová úložiště vytvořená před 17. dubnem 2024 budou zdarma do konce roku 2024; poté budou buď:

Účtována podle aktuálních sazeb (momentálně 0,10 USD/GB/den), pokud byla alespoň jednou použita v běhu Run vytvořeném po 17. dubnu 2024.
Odstraněna, pokud nebyla použita v žádném běhu Run mezi 17. dubnem 2024 a 31. prosincem 2024 — tím se má zabránit účtování za vektorová úložiště, která jste možná vytvořili před oznámením této změny cen, ale nikdy nepoužili.

Existuje limit, kolik asistentů mohu vytvořit?

Počet asistentů, které může organizace vytvořit, není omezen.

Je v API k dispozici streamování?

Ano, streamování je v Assistants API k dispozici.

Je v Assistants API k dispozici režim JSON?

Ano, režim JSON je v Assistants API k dispozici prostřednictvím parametru response_format u objektů Assistants nebo Run.

Bude Assistants API také spravovat požadavky na volání funkcí třetích stran?

Ne. I když volání funkce umožňuje modelu vybrat nástroje a formátovat pro ně požadavky, provádění volání nástrojů třetích stran OpenAI nespravuje.

Jak se nakládá s daty, která posílám OpenAI?

Stejně jako u zbytku naší platformy platí, že data a soubory předané do OpenAI API se nikdy nepoužívají k trénování našich modelů a svá data můžete kdykoli podle potřeby smazat. Data nahraná do Assistants API jsou uložena neomezeně dlouho, dokud je uživatel ručně nesmaže.

Je DALL-E k dispozici přes Assistants API?

DALL-E momentálně není k dispozici.

Existuje pro Assistants API uživatelské rozhraní?

Pro Assistants API si můžete vyzkoušet Playground. Ujistěte se, že jste v zobrazení Assistants na levém postranním panelu a používáte model kompatibilní s nástroji, které chcete zapnout.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

Jaký je limit počtu znaků pro pokyny asistenta v Assistants API?

Pole s pokyny asistenta má maximální délku 256 000 znaků.

Zobrazuje se mi chyba jako „Server při zpracování vašeho požadavku narazil na chybu. Omlouváme se za to! Požadavek můžete zkusit zopakovat, nebo nás kontaktovat prostřednictvím našeho centra nápovědy na help.openai.com, pokud chyba přetrvává. “ Co mám dělat?

Pokud se vám tato chyba zobrazuje, může to znamenat, že váš prompt není správně nastaven. Pokud požadavek opakovaně zkoušíte a stále selhává, vyzkoušejte následující:

nezapomeňte přepracovat prompt tak, aby příkazy podobné funkcím považoval za funkce
přidejte všechny příkazy v promptu jako funkci do tools

Proč můj nástroj File Search nefunguje dobře?

Při používání nástroje File Search doporučujeme nastavit max_prompt_tokens alespoň na 20 000. U delších konverzací nebo více interakcí s nástrojem File Search zvažte zvýšení tohoto limitu na 50 000, nebo v ideálním případě úplné odstranění limitů max_prompt_tokens, abyste získali výsledky nejvyšší kvality. Přečtěte si více zde.

Jak mohu poskytnout zpětnou vazbu?

Rádi si poslechneme vaši zpětnou vazbu na našem fóru pro vývojáře, prostřednictvím Centra nápovědy na help.openai.com nebo na Twitteru @OpenAIDevs.