ЧЗВ за Assistants API (v2)

Към 11 март 2025 г. пуснахме градивните елементи на новата ни платформа Agents. За подробности вижте нашата API документация за Responses API, инструменти, включително Web Search, File Search и Computer Use, както и нашия Agents SDK с Tracing. Въз основа на обратната ви връзка за Assistants API beta включихме ключови подобрения в Responses API. След като постигнем пълно съответствие на функциите, по-късно тази година ще обявим план за оттегляне на Assistants API с целева дата за окончателно спиране през първата половина на 2026 г.

Какво е Assistants API?

Assistants API позволява на разработчиците лесно да изграждат мощни AI асистенти в своите приложения. Този API премахва нуждата от управление на историята на разговорите и добавя достъп до инструменти, хоствани от OpenAI, като Интерпретатор на кодове и File Search. API също поддържа подобрено извикване на функция за инструменти на трети страни.

Мога ли все още да използвам Assistants API v1 beta?

Не. От 18 декември 2024 г. потребителите вече нямат достъп до версията v1 на Assistant API beta. В момента поддържаме само v2. Моля, разгледайте това ръководство за миграция, за да преобразувате API повикванията си от v1 към v2

Как да получа достъп до него?

Assistants API е наличен за всеки с OpenAI API акаунт, но е оттеглен и ще бъде премахнат през август 2026 г. За нови проекти вместо него използвайте Responses API. Ако вече използвате Assistants API, планирайте миграцията си към Responses API. Все още можете да осъществявате достъп до съществуващи асистенти в Assistants Playground, докато API остава наличен.

Какво е асистент?

Асистентът представлява специално създаден AI, който използва моделите на OpenAI и може да осъществява достъп до файлове, да поддържа постоянни нишки и да извиква инструменти.

Какво е нишка?

Нишката е сесия на разговор между асистент и потребител. Нишките опростяват разработването на приложения, като съхраняват историята на съобщенията и я съкращават, когато разговорът стане твърде дълъг за дължината на контекста на модела.

Какво е инструментът File Search?

Инструментът `file_search` прилага няколко добри практики за извличане още от самото начало, за да ви помогне да извлечете правилните данни от файловете си и да обогатите отговорите на модела. За повече информация, моля, прочетете нашата документация за разработчици.

По подразбиране инструментът file_search използва следните настройки:

Размер на част: 800 токена
Припокриване на части: 400 токена
Модел за вграждане: `text-embedding-3-large` с 256 измерения
Максимален брой части, добавени към контекста: 20

Какви са ограниченията за качване на файлове?

Ограниченията за качване на файл са:

512 MB на файл
5 млн. токена на файл
10 хил. файла на векторно хранилище
1 векторно хранилище на асистент
1 векторно хранилище на нишка

Общият лимит за съхранение за всеки проект в организация е 100 GB.

Какви са ограниченията на инструмента File Search?

Имаме няколко известни ограничения, за които работим да добавим поддръжка през следващите месеци:

В момента няма начин да се променят настройките за разделяне на части, вграждане или извличане.
Не поддържаме анализиране на изображения в документи.
Не поддържаме извличания върху структурирани файлови формати (като файлове .csv или .jsonl). Вижте поддържаните типове файлове.

Какви са лимитите на заявките за Assistants API?

Лимитите на заявките за Assistants API не са обвързани с нивото на използване и модела. Вместо това има лимити по подразбиране според типа заявка, с няколко изключения:

GET: 1000 RPM
POST: 300 RPM

DELETE: 300 заявки в минута

Как се ценообразува Интерпретатор на кодове в API?

Интерпретатор на кодове се таксува по $0.03 на сесия. Ако вашият асистент извика Интерпретатор на кодове едновременно в две различни нишки, това ще създаде две сесии на Интерпретатор на кодове (2 * $0.03). Всяка сесия по подразбиране е активна за един час, което означава, че ще платите тази такса само веднъж, ако потребителят ви продължи да дава инструкции на Интерпретатор на кодове в същата нишка до един час.

Как се ценообразува File Search в API?

File Search се таксува по $0.10/GB съхранение във векторно хранилище на ден (първият GB съхранение е безплатен). Размерът на векторното хранилище се базира на получения размер на векторното хранилище, след като файлът ви бъде анализиран, разделен на части и вграден.

Всички векторни хранилища, създадени преди 17 април 2024 г., ще бъдат безплатни до края на 2024 г., след което ще бъдат или:

Таксувани по текущите тарифи (понастоящем $0.10/GB/ден), ако са били използвани поне веднъж в Run, създаден след 17 април 2024 г.
Изтрити, ако не са били използвани в нито един Run между 17 април 2024 г. и 31 декември 2024 г. — това е, за да избегнете таксуване за векторни хранилища, които може да сте създали преди обявяването на тази промяна в цените, но никога не сте използвали.

Има ли лимит за броя асистенти, които мога да създам?

Няма лимит за броя асистенти, които една организация може да създаде.

Налично ли е стриймване в API?

Да, стриймването е налично в Assistants API.

Наличен ли е режим JSON в Assistants API?

Да, режимът JSON е наличен в Assistants API чрез параметъра response_format в обектите Assistants или Run.

Ще управлява ли Assistants API и заявки за извиквания на функции на трети страни?

Не. Въпреки че извикването на функция позволява на модела да избира инструменти и да форматира заявки за тях, изпълнението на повиквания към инструменти на трети страни не се управлява от OpenAI.

Как се обработват данните, които изпращам на OpenAI?

Както и в останалата част от нашата платформа, данните и файловете, предадени на OpenAI API, никога не се използват за обучение на нашите модели и можете да изтриете данните си, когато е необходимо. Данните, качени в Assistants API, се съхраняват за неопределено време, докато потребител не ги изтрие ръчно.

Наличен ли е DALL-E чрез Assistants API?

Към момента DALL-E не е наличен.

Има ли потребителски интерфейс за Assistants API?

Можете да разгледате Playground за Assistants API. Уверете се, че сте в изгледа Assistants в лявата странична лента и използвате модел, съвместим с инструментите, които искате да включите.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

Какъв е лимитът на символите за инструкции към асистент в Assistants API?

Полето за инструкции към асистент има максимална дължина от 256 000 символа.

Получавам грешка като „Сървърът получи грешка при обработката на заявката ви. Съжаляваме за това! Можете да опитате заявката си отново или да се свържете с нас чрез нашия помощен център на help.openai.com, ако грешката продължи. “ Какво да направя?

Ако получавате тази грешка, това може да означава, че подканата ви не е настроена правилно. Ако продължавате да опитвате заявката отново и тя не успява, ето няколко неща, които да опитате:

уверете се, че преструктурирате подканата си така, че да третира всички команди, подобни на функции, като функции
добавете всички команди в подканата си като функция към tools

Защо инструментът ми File Search не работи добре?

Когато използвате инструмента File Search, препоръчваме да зададете max_prompt_tokens на не по-малко от 20 000. За по-дълги разговори или множество взаимодействия с File Search обмислете да увеличите този лимит до 50 000 или, в идеалния случай, да премахнете изцяло лимитите max_prompt_tokens, за да получите резултати с най-високо качество. Прочетете повече тук.

Как мога да изпратя обратна връзка?

Ще се радваме да чуем обратната ви връзка в нашия форум за разработчици, чрез Помощния център на help.openai.com или в Twitter @OpenAIDevs.