Рівень масштабування на API Platform дає змогу заздалегідь придбати фіксовану кількість вхідних і вихідних токенів API за хвилину (так звані «токен-одиниці») для доступу до одного виділеного знімка моделі. Кожна токен-одиниця купується щонайменше на 30 днів.
Після підписання форми замовлення ви можете додавати й вилучати токен-одиниці через свій обліковий запис API Platform. Зверніть увагу: переглядати налаштування Рівня масштабування та купувати одиниці вхідних і вихідних токенів можуть лише власники організації й авторизовані користувачі.
Докладніше про ціни на Рівні масштабування.
Як отримати доступ до налаштувань Рівня масштабування?
Власники організації API Platform можуть відкрити налаштування Рівня масштабування, натиснувши значок шестерні Settings у верхньому правому куті сторінки та вибравши Scale Tier у розділі «Організація» в меню ліворуч на екрані.
Сторінка налаштувань Рівня масштабування дає змогу додавати потужність, переглядати використання вхідних токенів, планувати потужність, переглядати підготовлені токени й перевіряти авторизованих покупців.
Як придбати більше потужності?
Ви можете придбати потужність, натиснувши кнопку «Додати потужність» у верхньому правому куті сторінки Рівня масштабування. Актуальні відомості про надані обсяги TPM для одиниць вхідних і вихідних токенів див. на нашій головній сторінці Рівня масштабування.
Вибравши тип токенів для придбання, ви можете ввести кількість напряму або пересунути повзунок, щоб вибрати потрібну кількість токенів. Повзунок дає змогу легко переглядати зміни TPM у розділі «Підсумок» під час зміни кількості токенів. Ми також надамо рекомендацію щодо кількості одиниць, яку варто придбати, щоб покрити трафік за останні 30 днів.
Коли ви остаточно визначитеся з вибором, натисніть «Оформити замовлення», щоб підтвердити покупку в наступному модальному вікні.
Зверніть увагу: ціни, показані в нашому підсумку, є стандартними тарифами й не включають знижки, узгоджені у формі замовлення вашої організації. Усі застосовні знижки буде застосовано й відображено в рахунку, виставленому вашій організації. Усі придбані одиниці будуть активні до початку наступного розрахункового періоду, а після цього поновлюватимуться щодня.
Як увімкнути використання токенів Рівня масштабування для викликів?
Потрібно встановити перемикач Scale Tier Enabled у розділі Project Settings у положення ввімкнено.
Якщо ви використовуєте Completions API, також перегляньте нашу документацію з поясненням ключа service_tier, щоб вирішити, чи потрібно задавати його вручну, чи покладатися на поведінку за замовчуванням.
Для викликів Responses API за замовчуванням використовується service_tier=auto. Якщо для проєкту ввімкнено Scale Tier Enabled, запити без service_tier (або з auto) за замовчуванням використовуватимуть Рівень масштабування, коли доступна квота Рівня масштабування. Запити з service_tier=default використовуватимуть спільні обчислювальні ресурси/PAYG.
Як переглянути історію покупок і прострочені токени?
Ви можете переглянути історію покупок Рівня масштабування на сторінці Рівня масштабування, вибравши модель у розділі «Підготовлені токени».
Після вибору моделі внизу сторінки ви зможете переглянути розділи «Прострочені токени» та «Попередні транзакції».
Як змінити свою токенну потужність?
Ви можете змінити токенну потужність моделі, вибравши модель у розділі «Підготовлені токени» на сторінці Рівня масштабування. Після вибору моделі знайдіть свою покупку в розділі «Активні» й натисніть «Скасувати» поруч із нею, щоб внести зміни.
У модальному вікні можна ввести кількість одиниць для скасування напряму або скористатися повзунком, щоб моделювати TPM під час вибору.
Як переглянути RPM/TPM і використання Рівня масштабування?
Ви можете переглянути зведення використання API вашою організацією на сторінці Рівня масштабування. Усі дати й час указано за UTC, а дані можуть надходити із затримкою до 5 хвилин.
Ви можете переглянути використання на панелі активності використання, вибравши моделі Рівня масштабування в розкривному списку моделей. Ці дані можна переглядати у вікні 30 днів, 1 день і 15 хвилин. Дані про використання відображаються шарами: окремо показано обсяг використання моделі, покритий вашим Рівнем масштабування, і обсяг використання, покритий планом вашого облікового запису.
Зверніть увагу: переглядати панель використання можуть лише власники організації.
Коли зміна моєї токенної потужності відобразиться на панелі використання?
Внесені вами зміни можуть відображатися протягом до 24 годин. Самі зміни набувають чинності майже миттєво.
