Skaleringsnivå på API-plattformen lar deg kjøpe et fast antall API-inndata- og utdatatoken per minutt (kalt «tokenenheter») på forhånd for tilgang til ett dedikert modelløyeblikksbilde. Hver tokenenhet kjøpes for minst 30 dager.
Når du har signert et bestillingsskjema, kan du legge til og fjerne tokenenheter via API Platform-kontoen din. Merk at bare organisasjonseiere og autoriserte brukere kan se innstillingene for Skaleringsnivå og kjøpe inndata- og utdatatokenenheter.
Les mer om priser for Skaleringsnivå.
Hvordan får jeg tilgang til innstillingene for Skaleringsnivå?
Organisasjonseiere på API Platform kan åpne innstillingene for Scale tier ved å velge tannhjulet for Innstillinger øverst til høyre på siden og deretter velge Scale Tier under delen "Organization" i menyen på venstre side av skjermen.
Siden for innstillinger for Skaleringsnivå lar deg legge til mer kapasitet, se bruken av inndatatoken, planlegge kapasitet, se klargjorte token og gjennomgå autoriserte kjøpere.
Hvordan kan jeg kjøpe mer kapasitet?
Du kan kjøpe kapasitet ved å velge knappen Add capacity øverst til høyre på Scale tier-siden din. Se hovedsiden for Scale tier for de nyeste detaljene om TPM-rettigheter per inndata- og utdatatokenenhet.
Etter at du har valgt hvilken type token du vil kjøpe, kan du skrive inn et antall direkte eller flytte glidebryteren for å velge hvor mange token du vil kjøpe. Glidebryteren lar deg enkelt se TPM-endringene under Summary mens du endrer tokenene. Vi gir også en anbefaling om hvor mange enheter du bør kjøpe for å dekke trafikken din de siste 30 dagene.
Når du har fullført valget ditt, velger du Checkout for å bekrefte kjøpet i neste modalvindu.
Merk at prisene som vises i sammendraget vårt, er standardprisene våre og ikke inkluderer rabatter som er forhandlet frem i organisasjonens bestillingsskjema. Eventuelle gjeldende rabatter blir brukt og gjenspeiles i fakturaen som utstedes til organisasjonen din. Eventuelle kjøpte enheter vil være aktive frem til starten av neste fakturaperiode, og fornyes daglig etter det.
Hvordan aktiverer jeg anrop til å bruke token fra Skaleringsnivå?
Du må slå på bryteren Scale Tier Enabled under Project Settings.
Hvis du bruker Completions API, kan du også se dokumentasjonen vår som forklarer nøkkelen service_tier, for å avgjøre om du bør angi den manuelt eller stole på standardatferden.
Anrop til Responses API bruker som standard service_tier=auto. Hvis et prosjekt har Scale Tier Enabled, vil forespørsler som utelater service_tier (eller bruker auto) bruke Scale Tier som standard når kvote for Scale Tier er tilgjengelig. Forespørsler med service_tier=default vil bruke delt/PAYG-beregning.
Hvordan kan jeg se kjøpshistorikken min og utløpte token?
Du kan se kjøpshistorikken for Scale tier på Scale tier-siden din ved å velge en modell under Provisioned tokens.
Når du har valgt en modell, kan du se Expired tokens og Prior transactions nederst på siden.
Hvordan kan jeg redigere tokenkapasiteten min?
Du kan redigere tokenkapasiteten for en modell ved å velge en modell under Provisioned tokens på Scale tier-siden din. Når du har valgt en modell, finner du kjøpet ditt under overskriften Active og velger Cancel ved siden av kjøpet ditt for å redigere
I modalvinduet kan du skrive inn antall enheter som skal kanselleres direkte eller bruke glidebryteren til å modellere TPM mens du gjør valget ditt.
Hvordan kan jeg se RPM/TPM og bruk for Skaleringsnivå?
Du kan se et sammendrag av API-bruken for organisasjonen din på Scale tier-siden din. Alle datoer og klokkeslett er basert på UTC, og data kan være forsinket med opptil 5 minutter.
Du kan gjennomgå bruken din i Activity Usage Dashboard ved å velge Scale tier-modellene dine i rullegardinmenyen for modeller. Du kan se disse dataene i et vindu på 30 dager, 1 dag og 15 minutter. Bruksdataene dine er stablet for å vise hvor mye bruk for modellen som dekkes av Scale tier sammenlignet med hvor mye bruk som dekkes av kontoplanen din.
Merk at bare organisasjonseiere kan se Usage Dashboard.
Når vil endringen i tokenkapasitet vises i bruksdashbordet?
Det kan ta opptil 24 timer før endringene du gjør, blir gjenspeilet. Selve endringene trer i kraft nesten umiddelbart.
