Поширені запитання про Assistants API (v2)

Станом на 11 березня 2025 року ми випустили будівельні блоки нашої нової платформи Agents. Докладніше див. нашу документацію API для Responses API, інструментів, зокрема Web Search, File Search і Computer Use, а також нашого Agents SDK з Tracing. На основі ваших відгуків щодо бета-версії Assistants API ми внесли ключові покращення до Responses API. Після досягнення повної відповідності функцій ми оголосимо план припинення підтримки Assistants API пізніше цього року, з цільовою датою завершення роботи в першій половині 2026 року.

Що таке Assistants API?

Assistants API дає змогу розробникам легко створювати потужних AI-асистентів у своїх застосунках. Цей API усуває потребу керувати історією розмов і додає доступ до інструментів, розміщених OpenAI, як-от інтерпретатор коду та File Search. API також підтримує покращений виклик функцій для інструментів сторонніх розробників.

Чи можу я й надалі використовувати Assistants API v1 beta?

Ні. Станом на 18 грудня 2024 року користувачі більше не мають доступу до версії v1 Assistant API beta. Наразі ми підтримуємо лише v2. Перегляньте цей посібник із міграції, щоб перевести свої виклики API з v1 на v2

Як отримати до нього доступ?

Assistants API доступний усім, хто має обліковий запис OpenAI API, але він застарілий і буде вилучений у серпні 2026 року. Для нових проєктів натомість використовуйте Responses API. Якщо ви вже використовуєте Assistants API, заплануйте міграцію до Responses API. Ви все ще можете отримувати доступ до наявних асистентів у Assistants Playground, поки API залишається доступним.

Що таке Assistant?

Асистент — це спеціально створений AI, який використовує моделі OpenAI, може отримувати доступ до файлів, підтримувати сталі потоки та викликати інструменти.

Що таке Thread?

Потік — це сеанс розмови між асистентом і користувачем. Потоки спрощують розробку застосунків, зберігаючи історію повідомлень і скорочуючи її, коли розмова стає надто довгою для довжини контексту моделі.

Що таке інструмент File Search?

Інструмент `file_search` одразу реалізує кілька найкращих практик пошуку, щоб допомогти вам отримати потрібні дані з ваших файлів і доповнити відповіді моделі. Щоб дізнатися більше, прочитайте нашу документацію для розробників.

За замовчуванням інструмент file_search використовує такі налаштування:

Розмір фрагмента: 800 токенів
Перекриття фрагментів: 400 токенів
Модель вбудовування: `text-embedding-3-large` із 256 вимірами
Максимальна кількість фрагментів, доданих до контексту: 20

Які обмеження діють для завантаження файлів?

Обмеження для завантаження файлу:

512 МБ на файл
5 млн токенів на файл
10 тис. файлів на векторне сховище
1 векторне сховище на асистента
1 векторне сховище на потік

Загальний ліміт сховища для кожного проєкту в організації становить 100 ГБ.

Які обмеження має інструмент File Search?

Є кілька відомих обмежень, підтримку яких ми плануємо додати найближчими місяцями:

Наразі немає способу змінювати налаштування поділу на фрагменти, вбудовування або пошуку.
Ми не підтримуємо аналіз зображень у документах.
Ми не підтримуємо пошук у структурованих форматах файлів (наприклад, файлах .csv або .jsonl). Див. підтримувані типи файлів.

Які ліміти запитів для Assistants API?

Ліміти запитів для Assistants API не прив’язані до рівня використання та моделі. Натомість діють стандартні ліміти за типом запиту, з кількома винятками:

GET: 1000 RPM
POST: 300 RPM

DELETE: 300 запитів на хвилину

Як тарифікується інтерпретатор коду в API?

Інтерпретатор коду коштує $0.03 за сеанс. Якщо ваш асистент викликає інтерпретатор коду одночасно у двох різних потоках, це створить два сеанси інтерпретатора коду (2 * $0.03). Кожен сеанс за замовчуванням активний протягом однієї години, тобто ви сплатите цей збір лише один раз, якщо ваш користувач продовжує давати інструкції інтерпретатору коду в тому самому потоці до однієї години.

Як тарифікується File Search в API?

File Search коштує $0.10/ГБ сховища векторного сховища на день (перший ГБ сховища безкоштовний). Розмір векторного сховища визначається його підсумковим розміром після аналізу, поділу на фрагменти та вбудовування вашого файлу.

Усі векторні сховища, створені до 17 квітня 2024 року, будуть безкоштовними до кінця 2024 року, після чого їх буде або:

Стягнуто оплату за поточними тарифами (зараз $0.10/ГБ/день), якщо вони були використані принаймні один раз у Run, створеному після 17 квітня 2024 року.
Видалено, якщо вони не використовувалися в жодному Run між 17 квітня 2024 року та 31 грудня 2024 року — це потрібно, щоб уникнути нарахування плати за векторні сховища, які ви могли створити до оголошення цієї зміни цін, але ніколи не використовували.

Чи є обмеження на кількість асистентів, які я можу створити?

Немає обмеження на кількість асистентів, які може створити організація.

Чи доступна потокова передача в API?

Так, потокова передача доступна в Assistants API.

Чи доступний режим JSON в Assistants API?

Так, режим JSON доступний в Assistants API через параметр response_format в об’єктах Assistants або Run.

Чи керуватиме Assistants API також запитами для викликів функцій сторонніх розробників?

Ні. Хоча виклик функцій дає змогу моделі вибирати інструменти та форматувати запити до них, виконання викликів до інструментів сторонніх розробників не керується OpenAI.

Як обробляються дані, які я надсилаю до OpenAI?

Як і в решті нашої платформи, дані та файли, передані до OpenAI API, ніколи не використовуються для навчання наших моделей, і ви можете видалити свої дані, коли вам потрібно. Дані, завантажені до Assistants API, зберігаються безстроково, доки користувач не видалить їх вручну.

Чи доступний DALL-E через Assistants API?

Наразі DALL-E недоступний.

Чи є UI для Assistants API?

Ви можете переглянути Playground для Assistants API. Переконайтеся, що на лівій бічній панелі вибрано подання Assistants і що ви використовуєте модель, сумісну з інструментами, які хочете ввімкнути.

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

Який ліміт символів для інструкцій асистента в Assistants API?

Поле інструкцій асистента має максимальну довжину 256 000 символів.

Я отримую помилку на кшталт «Під час обробки вашого запиту на сервері сталася помилка. Перепрошуємо за це! Ви можете повторити запит або звернутися до нас через Довідковий центр за адресою help.openai.com, якщо помилка не зникає. » Що мені робити?

Якщо ви отримуєте цю помилку, це може означати, що ваш запит налаштовано неправильно. Якщо ви продовжуєте повторювати запит, а він не виконується, спробуйте таке:

переконайтеся, що ви перебудували свій запит так, щоб команди, схожі на функції, оброблялися як функції
додайте всі команди у своєму запиті як функцію до tools

Чому мій інструмент File Search працює неналежно?

Під час використання інструмента File Search рекомендуємо встановити max_prompt_tokens не менше ніж 20 000. Для довших розмов або кількох взаємодій із File Search розгляньте можливість збільшити цей ліміт до 50 000 або, в ідеалі, повністю прибрати ліміти max_prompt_tokens, щоб отримати результати найвищої якості. Докладніше читайте тут.

Як я можу надати відгук?

Будемо раді отримати ваш відгук на нашому форумі для розробників, через Довідковий центр за адресою help.openai.com або у Twitter @OpenAIDevs.