OpenAI
Тази страница е машинно преведена. Вижте оригиналната статия на английски език.

API Platform – Ниво на мащабиране за съществуващи корпоративни клиенти

Актуализирано: 3 days ago

Нивото на мащабиране в API Platform ви позволява предварително да закупите определен брой входни и изходни API токени в минута (известни като „единици токени“) за достъп до една специално заделена моментна версия на модел. Всяка единица токени се закупува за минимум 30 дни.

След като подпишете формуляр за поръчка, можете да добавяте и премахвате единици токени чрез своя акаунт в API Platform. Имайте предвид, че само собствениците на организацията и упълномощените потребители могат да преглеждат настройките за Ниво на мащабиране и да закупуват единици входни и изходни токени.


Научете повече за ценообразуването за Нивото на мащабиране.

Как мога да осъществя достъп до настройките си за Ниво на мащабиране?

Собствениците на организация в API Platform могат да осъществят достъп до настройките си за Ниво на мащабиране, като изберат зъбното колело за настройки горе вдясно на страницата и изберат „Ниво на мащабиране“ в секцията „Организация“ в менюто от лявата страна на екрана.

Image

Страницата с настройки за Ниво на мащабиране ви позволява да добавяте още капацитет, да преглеждате използването на входни токени, да планирате капацитет, да виждате предоставените си токени и да преглеждате упълномощените купувачи.

Как мога да закупя повече капацитет?

Можете да закупите капацитет, като изберете бутона „Добавяне на капацитет“ горе вдясно на страницата си за Ниво на мащабиране. Вижте нашата основна страница за Ниво на мащабиране за най-актуалната информация относно правата за TPM за единиците входни и изходни токени.

След като изберете типа токени, които ще закупите, можете директно да въведете сума или да преместите плъзгача, за да изберете броя токени, които искате да закупите. Плъзгачът ви позволява лесно да виждате промените в TPM под „Обобщение“, докато променяте токените. Ще предоставим и препоръка за броя единици, които да закупите, за да покриете трафика си за последните 30 дни.

Add token capacity dialog for gpt-4o with Input Tokens selected and input limit increasing from 40K to 60K

След като финализирате избора си, изберете „Плащане“, за да потвърдите покупката си в следващия модален прозорец.

Имайте предвид, че цените, показани в нашето обобщение, са стандартните ни тарифи и не включват отстъпки, договорени във формуляра за поръчка на вашата организация. Всички приложими отстъпки ще бъдат приложени и отразени във фактурата, издадена на вашата организация. Всички закупени единици ще бъдат активни до началото на следващия период на фактуриране и след това ще се подновяват ежедневно.

Как да разреша на заявките да използват токени от Нивото на мащабиране?

Трябва да включите превключвателя Scale Tier Enabled в Project Settings.

Ако използвате Completions API, вижте също нашата документация, която обяснява ключа service_tier, за да прецените дали да го зададете ръчно, или да разчитате на поведението по подразбиране.

Заявките към Responses API по подразбиране използват service_tier=auto. Ако за даден проект е активирано Scale Tier Enabled, заявките, които пропускат service_tier (или използват auto), по подразбиране ще използват Нивото на мащабиране, когато има налична квота за Ниво на мащабиране. Заявките със service_tier=default ще използват споделени/PAYG изчислителни ресурси.

Как мога да прегледам историята на покупките си и изтеклите токени?

Можете да прегледате историята на покупките си за Ниво на мащабиране на страницата си за Ниво на мащабиране, като изберете модел под „Предоставени токени“.

Provisioned tokens table with active allocations for gpt-4o and gpt-4o-mini

След като изберете модел, ще можете да прегледате „Изтекли токени“ и „Предишни трансакции“ в долната част на страницата.

Image

Как мога да редактирам капацитета си за токени?

Можете да редактирате капацитета за токени на даден модел, като изберете модел под „Предоставени токени“ на страницата си за Ниво на мащабиране. След като изберете модел, намерете покупката си под заглавието „Активни“ и изберете „Отказ“ до покупката си, за да я редактирате

Image

В модалния прозорец можете директно да въведете броя единици за отказване или да използвате плъзгача, за да моделирате TPM, докато правите избора си.

Edit Token Capacity dialog for gpt-4o canceling 1 package and reducing output limit TPM from 2.248M to 2.246M

Как мога да видя RPM/TPM и използването си за Ниво на мащабиране?

Можете да видите обобщение на използването на API за вашата организация на страницата си за Ниво на мащабиране. Всички дати и часове са базирани на UTC, а данните може да се забавят с до 5 минути.

Input token usage chart for the last 30 days with several spikes and a peak near 700K

Можете да прегледате използването си в таблото за използване на дейността, като изберете моделите си за Ниво на мащабиране от падащото меню за модели. Можете да преглеждате тези данни в прозорец от 30 дни, 1 ден и 15 минути. Данните за използването ви са подредени на слоеве, за да покажат обема на използване за модела, покрит от вашето Ниво на мащабиране, спрямо обема на използване, покрит от плана на акаунта ви.

Имайте предвид, че само собствениците на организацията могат да преглеждат таблото за използване.

Кога промяната в капацитета ми за токени ще се отрази в таблото за използване?

Отразяването на направените от вас промени може да отнеме до 24 часа. Самите промени ще влязат в сила почти незабавно.

Беше ли Ви полезна тази статия?