OpenAI
Для перекладу цієї сторінки виконано машинний переклад. Ви можете переглянути оригінальну статтю англійською.

API Platform — Рівень масштабування для наявних корпоративних клієнтів

Оновлено: yesterday

Рівень масштабування на API Platform дає змогу заздалегідь придбати фіксовану кількість вхідних і вихідних токенів API за хвилину (так звані «токен-одиниці») для доступу до одного виділеного знімка моделі. Кожна токен-одиниця купується щонайменше на 30 днів.

Після підписання форми замовлення ви можете додавати й вилучати токен-одиниці через свій обліковий запис API Platform. Зверніть увагу: переглядати налаштування Рівня масштабування та купувати одиниці вхідних і вихідних токенів можуть лише власники організації й авторизовані користувачі.


Докладніше про ціни на Рівні масштабування.

Як отримати доступ до налаштувань Рівня масштабування?

Власники організації API Platform можуть відкрити налаштування Рівня масштабування, натиснувши значок шестерні Settings у верхньому правому куті сторінки та вибравши Scale Tier у розділі «Організація» в меню ліворуч на екрані.

Image

Сторінка налаштувань Рівня масштабування дає змогу додавати потужність, переглядати використання вхідних токенів, планувати потужність, переглядати підготовлені токени й перевіряти авторизованих покупців.

Як придбати більше потужності?

Ви можете придбати потужність, натиснувши кнопку «Додати потужність» у верхньому правому куті сторінки Рівня масштабування. Актуальні відомості про надані обсяги TPM для одиниць вхідних і вихідних токенів див. на нашій головній сторінці Рівня масштабування.

Вибравши тип токенів для придбання, ви можете ввести кількість напряму або пересунути повзунок, щоб вибрати потрібну кількість токенів. Повзунок дає змогу легко переглядати зміни TPM у розділі «Підсумок» під час зміни кількості токенів. Ми також надамо рекомендацію щодо кількості одиниць, яку варто придбати, щоб покрити трафік за останні 30 днів.

Add token capacity dialog for gpt-4o with Input Tokens selected and input limit increasing from 40K to 60K

Коли ви остаточно визначитеся з вибором, натисніть «Оформити замовлення», щоб підтвердити покупку в наступному модальному вікні.

Зверніть увагу: ціни, показані в нашому підсумку, є стандартними тарифами й не включають знижки, узгоджені у формі замовлення вашої організації. Усі застосовні знижки буде застосовано й відображено в рахунку, виставленому вашій організації. Усі придбані одиниці будуть активні до початку наступного розрахункового періоду, а після цього поновлюватимуться щодня.

Як увімкнути використання токенів Рівня масштабування для викликів?

Потрібно встановити перемикач Scale Tier Enabled у розділі Project Settings у положення ввімкнено.

Якщо ви використовуєте Completions API, також перегляньте нашу документацію з поясненням ключа service_tier, щоб вирішити, чи потрібно задавати його вручну, чи покладатися на поведінку за замовчуванням.

Для викликів Responses API за замовчуванням використовується service_tier=auto. Якщо для проєкту ввімкнено Scale Tier Enabled, запити без service_tier (або з auto) за замовчуванням використовуватимуть Рівень масштабування, коли доступна квота Рівня масштабування. Запити з service_tier=default використовуватимуть спільні обчислювальні ресурси/PAYG.

Як переглянути історію покупок і прострочені токени?

Ви можете переглянути історію покупок Рівня масштабування на сторінці Рівня масштабування, вибравши модель у розділі «Підготовлені токени».

Provisioned tokens table with active allocations for gpt-4o and gpt-4o-mini

Після вибору моделі внизу сторінки ви зможете переглянути розділи «Прострочені токени» та «Попередні транзакції».

Image

Як змінити свою токенну потужність?

Ви можете змінити токенну потужність моделі, вибравши модель у розділі «Підготовлені токени» на сторінці Рівня масштабування. Після вибору моделі знайдіть свою покупку в розділі «Активні» й натисніть «Скасувати» поруч із нею, щоб внести зміни.

Image

У модальному вікні можна ввести кількість одиниць для скасування напряму або скористатися повзунком, щоб моделювати TPM під час вибору.

Edit Token Capacity dialog for gpt-4o canceling 1 package and reducing output limit TPM from 2.248M to 2.246M

Як переглянути RPM/TPM і використання Рівня масштабування?

Ви можете переглянути зведення використання API вашою організацією на сторінці Рівня масштабування. Усі дати й час указано за UTC, а дані можуть надходити із затримкою до 5 хвилин.

Input token usage chart for the last 30 days with several spikes and a peak near 700K

Ви можете переглянути використання на панелі активності використання, вибравши моделі Рівня масштабування в розкривному списку моделей. Ці дані можна переглядати у вікні 30 днів, 1 день і 15 хвилин. Дані про використання відображаються шарами: окремо показано обсяг використання моделі, покритий вашим Рівнем масштабування, і обсяг використання, покритий планом вашого облікового запису.

Зверніть увагу: переглядати панель використання можуть лише власники організації.

Коли зміна моєї токенної потужності відобразиться на панелі використання?

Внесені вами зміни можуть відображатися протягом до 24 годин. Самі зміни набувають чинності майже миттєво.

Чи була ця стаття корисною?