OpenAI
Táto stránka bola strojovo preložená. Prečítaj si pôvodný článok v angličtine.

Platforma API – úroveň škálovania pre existujúcich podnikových zákazníkov

Aktualizované: 2 days ago

Úroveň škálovania na platforme API vám umožňuje vopred zakúpiť stanovený počet vstupných a výstupných tokenov API za minútu (tzv. „tokenové jednotky“) na prístup k jednej vyhradenej snímke modelu. Každá tokenová jednotka sa kupuje minimálne na 30 dní.

Po podpísaní objednávkového formulára môžete tokenové jednotky pridávať a odstraňovať prostredníctvom svojho účtu na platforme API. Upozorňujeme, že nastavenia úrovne škálovania môžu zobrazovať a vstupné a výstupné tokenové jednotky nakupovať iba vlastníci organizácie a oprávnení používatelia.


Prečítajte si viac o cenách úrovne škálovania.

Ako získam prístup k nastaveniam úrovne škálovania?

Vlastníci organizácie na platforme API majú prístup k nastaveniam úrovne škálovania tak, že vyberú ozubené koliesko Nastavenia v pravom hornom rohu stránky a potom v ponuke na ľavej strane obrazovky vyberú možnosť Úroveň škálovania v časti „Organizácia“.

Image

Stránka nastavení úrovne škálovania vám umožňuje pridať ďalšiu kapacitu, zobraziť využitie vstupných tokenov, plánovať kapacitu, zobraziť poskytnuté tokeny a skontrolovať oprávnených nákupcov.

Ako si môžem kúpiť väčšiu kapacitu?

Kapacitu si môžete zakúpiť výberom tlačidla Pridať kapacitu v pravom hornom rohu stránky úrovne škálovania. Najnovšie podrobnosti o nárokoch TPM pre vstupné a výstupné tokenové jednotky nájdete na našej hlavnej stránke úrovne škálovania.

Po výbere typu tokenov, ktoré chcete kúpiť, môžete priamo zadať množstvo alebo posunutím jazdca vybrať počet tokenov, ktoré si chcete zakúpiť. Jazdec vám umožňuje jednoducho sledovať zmeny TPM v časti Súhrn pri zmene počtu tokenov. Poskytneme vám aj odporúčanie počtu jednotiek, ktoré je potrebné zakúpiť na pokrytie vašej prevádzky za posledných 30 dní.

Add token capacity dialog for gpt-4o with Input Tokens selected and input limit increasing from 40K to 60K

Po dokončení výberu potvrďte nákup v nasledujúcom modálnom okne výberom možnosti Pokladňa.

Upozorňujeme, že ceny zobrazené v našom súhrne sú naše štandardné sadzby a nezahŕňajú žiadne zľavy dohodnuté v objednávkovom formulári vašej organizácie. Všetky príslušné zľavy sa uplatnia a zobrazia vo faktúre vystavenej vašej organizácii. Všetky zakúpené jednotky budú aktívne do začiatku ďalšieho fakturačného obdobia a potom sa budú denne obnovovať.

Ako povolím volaniam používať tokeny úrovne škálovania?

V nastaveniach projektu musíte zapnúť prepínač Scale Tier Enabled.

Ak používate rozhranie Completions API, pozrite si aj našu dokumentáciu, ktorá vysvetľuje kľúč service_tier, aby ste sa mohli rozhodnúť, či ho máte nastaviť manuálne alebo sa spoľahnúť na predvolené správanie.

Volania rozhrania Responses API majú predvolene nastavené service_tier=auto. Ak má projekt zapnutú možnosť Scale Tier Enabled, požiadavky, ktoré vynechajú service_tier (alebo použijú auto), budú predvolene používať úroveň škálovania, keď je dostupná jej kvóta. Požiadavky so service_tier=default budú používať zdieľané výpočtové prostriedky PAYG.

Ako si môžem zobraziť históriu nákupov a tokeny, ktorých platnosť vypršala?

Históriu nákupov úrovne škálovania si môžete zobraziť na svojej stránke úrovne škálovania výberom modelu v časti Poskytnuté tokeny.

Provisioned tokens table with active allocations for gpt-4o and gpt-4o-mini

Po výbere modelu si v dolnej časti stránky budete môcť zobraziť položky Tokeny po uplynutí platnosti a Predchádzajúce transakcie.

Image

Ako môžem upraviť svoju kapacitu tokenov?

Kapacitu tokenov modelu môžete upraviť výberom modelu v časti Poskytnuté tokeny na svojej stránke úrovne škálovania. Po výbere modelu nájdite svoj nákup pod hlavičkou Aktívne a výberom možnosti Zrušiť vedľa nákupu ho upravte.

Image

V modálnom okne môžete priamo zadať počet jednotiek na zrušenie alebo pomocou jazdca modelovať TPM pri výbere.

Edit Token Capacity dialog for gpt-4o canceling 1 package and reducing output limit TPM from 2.248M to 2.246M

Ako si môžem zobraziť RPM/TPM a používanie úrovne škálovania?

Súhrn používania API pre vašu organizáciu si môžete zobraziť na svojej stránke úrovne škálovania. Všetky dátumy a časy sú založené na UTC a údaje môžu byť oneskorené až o 5 minút.

Input token usage chart for the last 30 days with several spikes and a peak near 700K

Svoje používanie si môžete skontrolovať na paneli používania aktivity výberom modelov úrovne škálovania v rozbaľovacom zozname modelov. Tieto údaje si môžete zobraziť v 30-dňovom, 1-dňovom a 15-minútovom okne. Údaje o používaní sú zobrazené vrstvene, aby ukázali objem používania modelu pokrytého vašou úrovňou škálovania v porovnaní s objemom používania pokrytým plánom vášho účtu.

Upozorňujeme, že panel používania môžu zobraziť iba vlastníci organizácie.

Kedy sa zmena mojej kapacity tokenov prejaví na paneli používania?

Môže trvať až 24 hodín, kým sa vykonané zmeny zobrazia. Samotné zmeny nadobudnú účinnosť takmer okamžite.

Bol tento článok užitočný?