OpenAI
Тази страница е машинно преведена. Вижте оригиналната статия на английски език.

ЧЗВ за Assistants API (v2)

Актуализирано: 4 hours ago

Към 11 март 2025 г. пуснахме основните градивни елементи на новата ни платформа Agents. За подробности вижте нашата API документация за Responses API, Tools, включително Web Search, File Search и Computer Use, както и нашия Agents SDK с Tracing. Въз основа на вашата обратна връзка за бета версията на Assistants API, внедрихме ключови подобрения в Responses API. След като постигнем пълна еквивалентност на функциите, по-късно тази година ще обявим план за прекратяване на Assistants API, с целева дата за спиране през първата половина на 2026 г.

Какво е Assistants API?

Assistants API позволява на разработчиците лесно да създават мощни AI асистенти в своите приложения. Това API премахва нуждата от управление на историята на разговорите и добавя достъп до инструменти, хоствани от OpenAI, като Интерпретатор на кодове и File Search. API също така поддържа подобрено извикване на функция за инструменти на трети страни.

Мога ли все още да използвам Assistants API v1 beta?

Не. Към 18 декември 2024 г. потребителите вече нямат достъп до версията v1 на бета Assistants API. В момента поддържаме само v2. Моля, вижте това ръководство за миграция, за да преобразувате своите API извиквания от v1 към v2

Как да получа достъп?

Assistants API е достъпен за всеки с OpenAI API акаунт. Можете също да започнете чрез Assistants Playground.

Какво е Assistant?

Assistant представлява AI, създаден за конкретна цел, който използва модели на OpenAI и може да има достъп до файлове, да поддържа постоянни нишки и да извиква инструменти.

Какво е Thread?

Thread е сесия на разговор между асистент и потребител. Threads опростяват разработката на приложения, като съхраняват историята на съобщенията и я съкращават, когато разговорът стане твърде дълъг за контекстната дължина на модела.

Какво представлява инструментът File Search?

Инструментът file_search реализира няколко добри практики за извличане по подразбиране, за да ви помогне да извлечете правилните данни от файловете си и да подобрите отговорите на модела. За повече информация прочетете нашата документация за разработчици.

По подразбиране инструментът file_search използва следните настройки:

  • Размер на фрагмента: 800 токена

  • Припокриване на фрагментите: 400 токена

  • Embedding модел: text-embedding-3-large с 256 измерения

  • Максимален брой фрагменти, добавени към контекста: 20

Какви са ограниченията за качване на File?

Ограниченията за качване на File са:

  • 512 MB на файл

  • 5M токена на файл

  • 10k файла на vector store

  • 1 vector store на асистент

  • 1 vector store на thread

Общото ограничение за съхранение за всеки проект в организация е 100 GB.

Какви са ограниченията на инструмента File Search?

Имаме няколко известни ограничения, за които работим да добавим поддръжка през следващите месеци:

  1. В момента няма начин да се променят настройките за chunking, embedding или retrieval.

  2. Не поддържаме обработка на изображения в документи.

  3. Не поддържаме извличане върху структурирани файлови формати (като файлове .csv или .jsonl). Вижте поддържаните типове файлове.

Какви са ограниченията на скоростта за Assistants API?

Ограниченията на скоростта за Assistants API не са обвързани с нивото на използване и модела. Вместо това има ограничения по подразбиране според типа заявка, с няколко изключения:

  • GET: 1000 RPM

  • POST: 300 RPM

    • POST към /v1/threads/<thread_id>/runs: 200 RPM

    • POST към /v1/threads/runs: 200 RPM

  • DELETE: 300 заявки в минута

Как се определя цената на Интерпретатор на кодове в API?

Интерпретатор на кодове се таксува по $0.03 / сесия. Ако вашият асистент извика Интерпретатор на кодове едновременно в две различни нишки, това ще създаде две сесии на Интерпретатор на кодове (2 * $0.03). Всяка сесия е активна по подразбиране за един час, което означава, че ще платите тази такса само веднъж, ако потребителят ви продължи да дава инструкции на Интерпретатор на кодове в същата нишка до един час.

Как се определя цената на File Search в API?

File Search се таксува по $0.10/GB за съхранение на vector store на ден (първият GB съхранение е безплатен). Размерът на vector store се базира на крайния му размер, след като файлът ви бъде обработен, разделен на фрагменти и векторизиран.

Всички vector stores, създадени преди 17 април 2024 г., ще бъдат безплатни до края на 2024 г., след което или ще бъдат:

  • Таксувани по текущите тарифи (в момента $0.10/GB/ден), ако са били използвани поне веднъж в Run, създаден след 17 април 2024 г.

  • Изтрити, ако не са били използвани в нито един Run между 17 април 2024 г. и 31 декември 2024 г. — това е, за да се избегне таксуването ви за vector stores, които може да сте създали преди обявяването на тази промяна в цените, но никога да не сте използвали.

Има ли ограничение за броя асистенти, които мога да създам?

Няма ограничение за броя асистенти, които една организация може да създаде.

Налично ли е streaming в API?

Да, streaming е налично в Assistants API.

Наличен ли е JSON mode в Assistants API?

Да, JSON mode е наличен в Assistants API чрез параметъра response_format в обектите Assistants или Run.

Assistants API управлява ли и заявки за извиквания на функции от трети страни?

Не. Макар че извикване на функция позволява на модела да избира инструменти и да форматира заявки за тях, изпълнението на извиквания към инструменти на трети страни не се управлява от OpenAI.

Как се обработват данните, които изпращам до OpenAI?

Както и за останалата част от нашата платформа, данните и файловете, предадени към OpenAI API, никога не се използват за обучение на нашите модели и можете да изтриете данните си, когато пожелаете. Данните, качени в Assistants API, се съхраняват за неопределено време, докато потребителят не ги изтрие ръчно.

DALL-E наличен ли е чрез Assistants API?

Към момента DALL-E не е наличен.

Има ли UI за Assistants API?

Можете да разгледате Playground за Assistants API. Уверете се, че сте в изглед Assistants в лявата странична лента и използвате модел, съвместим с Tools, които искате да активирате.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

Какво е ограничението на знаците за инструкциите на асистента в Assistants API?

Системните инструкции, които асистентът използва, имат максимална дължина от 256 000 знака.

Получавам грешка като „The server had an error while processing your request. Sorry about that! You can retry your request, or contact us through our help center at help.openai.com if the error persists. “ Какво трябва да направя?

Ако получавате тази грешка, това може да означава, че вашата подкана не е настроена правилно. Ако продължавате да опитвате отново заявката и тя е неуспешна, ето няколко неща, които да пробвате:

  1. уверете се, че преформулирате подкана си така, че всички команди, подобни на функции, да се третират като функции

  2. добавете всички команди в подкана си като функция към tools

Защо инструментът ми File Search не работи добре?

Когато използвате инструмента File Search, препоръчваме да зададете max_prompt_tokens на не по-малко от 20 000. За по-дълги разговори или множество взаимодействия с File Search обмислете увеличаване на това ограничение до 50 000 или в идеалния случай изцяло премахнете ограниченията на max_prompt_tokens, за да получите резултати с най-високо качество. Прочетете повече тук.

Как мога да предоставя обратна връзка?

Ще се радваме да чуем вашата обратна връзка в нашия Форум за разработчици, чрез Помощен център на help.openai.com или в Twitter @OpenAIDevs.

Беше ли Ви полезна тази статия?