OpenAI
Tato stránka byla přeložena strojově. Zobrazit původní článek v angličtině.

API Platform – úroveň škálování pro stávající podnikové zákazníky

Aktualizováno: 3 days ago

Úroveň škálování na platformě API Platform vám umožňuje předem zakoupit stanovený počet vstupních a výstupních tokenů API za minutu (tzv. „tokenových jednotek“) a získat tak přístup k jednomu vyhrazenému snapshotu modelu. Každá tokenová jednotka se kupuje minimálně na 30 dní.

Po podepsání objednávkového formuláře můžete tokenové jednotky přidávat a odebírat prostřednictvím svého účtu API Platform. Upozorňujeme, že nastavení úrovně škálování mohou zobrazovat a vstupní a výstupní tokenové jednotky nakupovat pouze vlastníci organizace a oprávnění uživatelé.


Další informace o cenách úrovně škálování.

Jak získám přístup k nastavení úrovně škálování?

Vlastníci organizace API Platform mají k nastavení úrovně škálování přístup tak, že vpravo nahoře na stránce vyberou ozubené kolečko Nastavení a v nabídce na levé straně obrazovky v části „Organizace“ vyberou Úroveň škálování.

Image

Stránka nastavení úrovně škálování vám umožňuje přidat další kapacitu, zobrazit využití vstupních tokenů, plánovat kapacitu, zobrazit zřízené tokeny a zkontrolovat oprávněné nákupčí.

Jak si mohu koupit další kapacitu?

Kapacitu můžete zakoupit výběrem tlačítka Přidat kapacitu vpravo nahoře na stránce úrovně škálování. Nejnovější podrobnosti o nárocích na TPM pro vstupní a výstupní tokenové jednotky najdete na naší hlavní stránce úrovně škálování.

Po výběru typu tokenů, které chcete zakoupit, můžete přímo zadat částku nebo pomocí posuvníku vybrat počet tokenů k nákupu. Posuvník vám umožňuje snadno zobrazovat změny TPM v části Souhrn při změně počtu tokenů. Také vám doporučíme počet jednotek, které je vhodné zakoupit, aby pokryly provoz za posledních 30 dní.

Add token capacity dialog for gpt-4o with Input Tokens selected and input limit increasing from 40K to 60K

Jakmile výběr dokončíte, vyberte možnost Pokladna a v dalším modálním okně nákup potvrďte.

Upozorňujeme, že ceny uvedené v našem souhrnu jsou naše standardní sazby a nezahrnují žádné slevy sjednané v objednávkovém formuláři vaší organizace. Veškeré příslušné slevy budou uplatněny a promítnuty do faktury vystavené vaší organizaci. Všechny zakoupené jednotky budou aktivní do začátku dalšího fakturačního období a poté se budou denně obnovovat.

Jak povolím, aby volání používala tokeny úrovně škálování?

V části Nastavení projektu je třeba přepnout přepínač Scale Tier Enabled do zapnuté polohy.

Pokud používáte Completions API, podívejte se také na naši dokumentaci vysvětlující klíč service_tier, abyste se mohli rozhodnout, zda jej nastavit ručně, nebo se spolehnout na výchozí chování.

Volání Responses API mají ve výchozím nastavení service_tier=auto. Pokud má projekt zapnutou možnost Scale Tier Enabled, budou požadavky, které vynechají service_tier (nebo použijí auto), při dostupné kvótě úrovně škálování ve výchozím nastavení používat úroveň škálování. Požadavky s service_tier=default budou používat sdílený výpočetní výkon / PAYG.

Jak si mohu zobrazit historii nákupů a tokeny s ukončenou platností?

Historii nákupů úrovně škálování si můžete zobrazit na stránce úrovně škálování výběrem modelu v části Zřízené tokeny.

Provisioned tokens table with active allocations for gpt-4o and gpt-4o-mini

Po výběru modelu uvidíte dole na stránce Tokeny s ukončenou platností a Předchozí transakce.

Image

Jak mohu upravit kapacitu tokenů?

Kapacitu tokenů modelu můžete upravit výběrem modelu v části Zřízené tokeny na stránce úrovně škálování. Po výběru modelu najděte svůj nákup v části Aktivní a vedle něj vyberte Zrušit, abyste jej mohli upravit.

Image

V modálním okně můžete přímo zadat počet jednotek ke zrušení nebo pomocí posuvníku modelovat TPM při výběru.

Edit Token Capacity dialog for gpt-4o canceling 1 package and reducing output limit TPM from 2.248M to 2.246M

Jak si mohu zobrazit RPM/TPM a využití úrovně škálování?

Souhrn využití API pro svou organizaci si můžete zobrazit na stránce úrovně škálování. Všechna data a časy vycházejí z UTC a data mohou mít zpoždění až 5 minut.

Input token usage chart for the last 30 days with several spikes and a peak near 700K

Své využití si můžete prohlédnout na řídicím panelu využití aktivity výběrem modelů úrovně škálování v rozevíracím seznamu modelů. Tato data si můžete zobrazit v okně 30 dní, 1 dne a 15 minut. Údaje o využití jsou vrstvené tak, aby ukazovaly objem využití pro model pokrytý vaší úrovní škálování oproti objemu využití pokrytému tarifem vašeho účtu.

Upozorňujeme, že řídicí panel využití mohou zobrazit pouze vlastníci organizace.

Kdy se změna kapacity tokenů projeví na řídicím panelu využití?

Může trvat až 24 hodin, než se provedené změny projeví. Samotné změny začnou platit téměř okamžitě.

Byl tento článek užitečný?