Skaleringsnivå på API-plattformen lar deg kjøpe et fast antall API-token for inndata og utdata per minutt (kalt «tokenenheter») på forhånd for tilgang til ett dedikert øyeblikksbilde av en modell. Hver tokenenhet kjøpes for minst 30 dager.
Når du har signert et bestillingsskjema, kan du legge til og fjerne tokenenheter via API Platform-kontoen din. Vær oppmerksom på at bare organisasjonseiere og autoriserte brukere kan se innstillinger for Skaleringsnivå og kjøpe tokenenheter for inndata og utdata.
Finn ut mer om priser for Skaleringsnivå.
Hvordan får jeg tilgang til innstillingene for Skaleringsnivå?
Organisasjonseiere på API-plattformen får tilgang til innstillingene for Skaleringsnivå ved å velge tannhjulet for Innstillinger øverst til høyre på siden og velge Skaleringsnivå under delen «Organisasjon» i menyen på venstre side av skjermen.
Innstillingssiden for Skaleringsnivå lar deg legge til mer kapasitet, se bruken av inndata-token, planlegge kapasitet, se klargjorte token og gå gjennom autoriserte kjøpere.
Hvordan kan jeg kjøpe mer kapasitet?
Du kan kjøpe kapasitet ved å velge knappen Legg til kapasitet øverst til høyre på Skaleringsnivå-siden. Se hovedsiden for Skaleringsnivå for den nyeste informasjonen om TPM-rettigheter per tokenenhet for inndata og utdata.
Når du har valgt typen token du vil kjøpe, kan du angi et antall direkte eller flytte glidebryteren for å velge antallet token du vil kjøpe. Glidebryteren gjør det enkelt å se TPM-endringene under Sammendrag mens du endrer antallet token. Vi gir også en anbefaling om hvor mange enheter du bør kjøpe for å dekke trafikken din de siste 30 dagene.
Når du har fullført valget, velger du Gå til kassen for å bekrefte kjøpet i neste dialogvindu.
Vær oppmerksom på at prisene som vises i sammendraget, er standardprisene våre og ikke inkluderer rabatter som er forhandlet frem i organisasjonens bestillingsskjema. Eventuelle rabatter blir brukt og vises på fakturaen som utstedes til organisasjonen din. Alle enheter du kjøper, vil være aktive frem til starten av neste fakturaperiode og fornyes daglig etter det.
Hvordan aktiverer jeg kall til å bruke token fra Skaleringsnivå?
Du må slå på bryteren Scale Tier Enabled under Prosjektinnstillinger.
Hvis du bruker Completions API, kan du også se dokumentasjonen vår som forklarer nøkkelen service_tier, for å avgjøre om du bør angi den manuelt eller bruke standardatferden.
Kall til Responses API bruker service_tier=auto som standard. Hvis et prosjekt har Scale Tier Enabled, vil forespørsler som utelater service_tier (eller bruker auto), bruke Skaleringsnivå som standard når Skaleringsnivå-kvote er tilgjengelig. Forespørsler med service_tier=default vil bruke delt/PAYG-beregningskapasitet.
Hvordan kan jeg se kjøpshistorikken min og utløpte token?
Du kan se kjøpshistorikken for Skaleringsnivå på Skaleringsnivå-siden ved å velge en modell under Klargjorte token.
Når du har valgt en modell, kan du se Utløpte token og Tidligere transaksjoner nederst på siden.
Hvordan kan jeg redigere tokenkapasiteten min?
Du kan redigere tokenkapasiteten for en modell ved å velge en modell under Klargjorte token på Skaleringsnivå-siden. Når du har valgt en modell, finner du kjøpet ditt under overskriften Aktiv og velger Avbryt ved siden av kjøpet for å redigere det
I dialogvinduet kan du angi antallet enheter som skal kanselleres direkte, eller bruke glidebryteren til å modellere TPM mens du gjør valget.
Hvordan kan jeg se RPM/TPM og bruken for Skaleringsnivå?
Du kan se et sammendrag av API-bruken for organisasjonen på Skaleringsnivå-siden. Alle datoer og klokkeslett er basert på UTC, og data kan være opptil 5 minutter forsinket.
Du kan se gjennom bruken din i kontrollpanelet for aktivitetsbruk ved å velge Skaleringsnivå-modellene dine i rullegardinmenyen for modeller. Du kan vise disse dataene i vinduer på 30 dager, 1 dag og 15 minutter. Bruksdataene dine er stablet for å vise hvor mye bruk som dekkes av modellen på Skaleringsnivå, sammenlignet med hvor mye bruk som dekkes av kontoabonnementet ditt.
Vær oppmerksom på at bare organisasjonseiere kan se kontrollpanelet for bruk.
Når blir endringen i tokenkapasitet synlig i kontrollpanelet for bruk?
Det kan ta opptil 24 timer før endringene du gjør, vises. Selve endringene trer i kraft nesten umiddelbart.
