OpenAI
Deze pagina is automatisch vertaald. Bekijk het oorspronkelijke Engelstalige artikel.

API Platform - Scale Tier voor bestaande Enterprise-klanten

Bijgewerkt: 21 hours ago

Met Scale Tier op het API Platform kun je vooraf een vast aantal API-invoer- en -uitvoertokens per minuut kopen (zogenoemde ‘token-eenheden’) voor toegang tot één toegewezen modelsnapshot. Elke token-eenheid wordt voor minimaal 30 dagen gekocht.

Zodra je een orderformulier hebt ondertekend, kun je token-eenheden toevoegen en verwijderen via je API Platform-account. Let op: alleen organisatie-eigenaren en geautoriseerde gebruikers kunnen Scale Tier-instellingen bekijken en token-eenheden voor invoer en uitvoer kopen.


Lees meer over prijzen voor Scale Tier.

Hoe krijg ik toegang tot mijn Scale Tier-instellingen?

Eigenaren van API Platform-organisaties kunnen hun Scale Tier-instellingen openen door rechtsboven op de pagina het tandwiel Instellingen te selecteren en vervolgens in het menu links op het scherm onder de sectie ‘Organisatie’ Scale Tier te selecteren.

Image

Op de instellingenpagina van Scale Tier kun je meer capaciteit toevoegen, je gebruik van invoertokens bekijken, capaciteit plannen, je geprovisioneerde tokens bekijken en je geautoriseerde kopers controleren.

Hoe kan ik meer capaciteit kopen?

Je kunt capaciteit kopen door rechtsboven op je Scale Tier-pagina de knop Capaciteit toevoegen te selecteren. Bekijk onze hoofdpagina voor Scale Tier voor de nieuwste informatie over de TPM-toewijzingen per token-eenheid voor invoer en uitvoer.

Nadat je het type tokens hebt geselecteerd dat je wilt kopen, kun je rechtstreeks een aantal invoeren of de schuifregelaar gebruiken om het gewenste aantal tokens te selecteren. Met de schuifregelaar kun je onder Samenvatting eenvoudig zien hoe de TPM verandert wanneer je de tokens aanpast. We geven ook een aanbeveling voor het aantal eenheden dat je moet kopen om je verkeer van de afgelopen 30 dagen te dekken.

Add token capacity dialog for gpt-4o with Input Tokens selected and input limit increasing from 40K to 60K

Als je je selectie hebt afgerond, selecteer je Afrekenen om je aankoop in het volgende dialoogvenster te bevestigen.

Let op: de prijzen in onze samenvatting zijn onze standaardtarieven en bevatten geen kortingen die in het orderformulier van je organisatie zijn onderhandeld. Eventuele toepasselijke kortingen worden toegepast en weergegeven op de factuur die aan je organisatie wordt uitgegeven. Gekochte eenheden blijven actief tot het begin van de volgende factuurperiode en worden daarna dagelijks verlengd.

Hoe schakel ik in dat aanroepen Scale Tier-tokens gebruiken?

Je moet de schakelaar Scale Tier Enabled onder Projectinstellingen inschakelen.

Als je de Completions API gebruikt, bekijk dan ook onze documentatie over de sleutel service_tier om te bepalen of je die handmatig moet instellen of op het standaardgedrag kunt vertrouwen.

Aanroepen naar de Responses API gebruiken standaard service_tier=auto. Als Scale Tier Enabled voor een project is ingeschakeld, gebruiken aanvragen die service_tier weglaten (of auto gebruiken) standaard Scale Tier wanneer er Scale Tier-quota beschikbaar is. Aanvragen met service_tier=default gebruiken gedeelde/PAYG-compute.

Hoe kan ik mijn aankoopgeschiedenis en verlopen tokens bekijken?

Je kunt je aankoopgeschiedenis voor Scale Tier bekijken op je Scale Tier-pagina door onder Geprovisioneerde tokens een model te selecteren.

Provisioned tokens table with active allocations for gpt-4o and gpt-4o-mini

Nadat je een model hebt geselecteerd, kun je onderaan de pagina Verlopen tokens en Eerdere transacties bekijken.

Image

Hoe kan ik mijn tokencapaciteit bewerken?

Je kunt de tokencapaciteit van een model bewerken door op je Scale Tier-pagina onder Geprovisioneerde tokens een model te selecteren. Nadat je een model hebt geselecteerd, zoek je je aankoop onder de kop Actief en selecteer je Annuleren naast je aankoop om deze te bewerken

Image

In het dialoogvenster kun je rechtstreeks het aantal te annuleren eenheden invoeren of de schuifregelaar gebruiken om de TPM te modelleren terwijl je je selectie maakt.

Edit Token Capacity dialog for gpt-4o canceling 1 package and reducing output limit TPM from 2.248M to 2.246M

Hoe kan ik mijn Scale Tier-RPM/TPM en gebruik bekijken?

Je kunt een samenvatting van het API-gebruik voor je organisatie bekijken op je Scale Tier-pagina. Alle datums en tijden zijn gebaseerd op UTC, en gegevens kunnen tot 5 minuten vertraagd zijn.

Input token usage chart for the last 30 days with several spikes and a peak near 700K

Je kunt je gebruik bekijken in het Gebruiksdashboard voor activiteit door je Scale Tier-modellen te selecteren in de vervolgkeuzelijst voor modellen. Je kunt deze gegevens bekijken in perioden van 30 dagen, 1 dag en 15 minuten. Je gebruiksgegevens worden gestapeld weergegeven om het gebruik weer te geven voor het model dat door je Scale Tier wordt gedekt, vergeleken met het gebruik dat door je accountabonnement wordt gedekt.

Let op: alleen organisatie-eigenaren kunnen het gebruiksdashboard bekijken.

Wanneer zie ik mijn wijziging in tokencapaciteit terug in het gebruiksdashboard?

Het kan tot 24 uur duren voordat je wijzigingen worden weergegeven. De wijzigingen zelf gaan vrijwel onmiddellijk in.

Was dit artikel nuttig?