OpenAI
Denne siden ble maskinoversatt. Se den opprinnelige engelske artikkelen.

API Platform – Skaleringsnivå for eksisterende bedriftskunder

Oppdatert: yesterday

Skaleringsnivå på API-plattformen lar deg kjøpe et fast antall API-token for inndata og utdata per minutt (kalt «tokenenheter») på forhånd for tilgang til ett dedikert øyeblikksbilde av en modell. Hver tokenenhet kjøpes for minst 30 dager.

Når du har signert et bestillingsskjema, kan du legge til og fjerne tokenenheter via API Platform-kontoen din. Vær oppmerksom på at bare organisasjonseiere og autoriserte brukere kan se innstillinger for Skaleringsnivå og kjøpe tokenenheter for inndata og utdata.


Finn ut mer om priser for Skaleringsnivå.

Hvordan får jeg tilgang til innstillingene for Skaleringsnivå?

Organisasjonseiere på API-plattformen får tilgang til innstillingene for Skaleringsnivå ved å velge tannhjulet for Innstillinger øverst til høyre på siden og velge Skaleringsnivå under delen «Organisasjon» i menyen på venstre side av skjermen.

Image

Innstillingssiden for Skaleringsnivå lar deg legge til mer kapasitet, se bruken av inndata-token, planlegge kapasitet, se klargjorte token og gå gjennom autoriserte kjøpere.

Hvordan kan jeg kjøpe mer kapasitet?

Du kan kjøpe kapasitet ved å velge knappen Legg til kapasitet øverst til høyre på Skaleringsnivå-siden. Se hovedsiden for Skaleringsnivå for den nyeste informasjonen om TPM-rettigheter per tokenenhet for inndata og utdata.

Når du har valgt typen token du vil kjøpe, kan du angi et antall direkte eller flytte glidebryteren for å velge antallet token du vil kjøpe. Glidebryteren gjør det enkelt å se TPM-endringene under Sammendrag mens du endrer antallet token. Vi gir også en anbefaling om hvor mange enheter du bør kjøpe for å dekke trafikken din de siste 30 dagene.

Add token capacity dialog for gpt-4o with Input Tokens selected and input limit increasing from 40K to 60K

Når du har fullført valget, velger du Gå til kassen for å bekrefte kjøpet i neste dialogvindu.

Vær oppmerksom på at prisene som vises i sammendraget, er standardprisene våre og ikke inkluderer rabatter som er forhandlet frem i organisasjonens bestillingsskjema. Eventuelle rabatter blir brukt og vises på fakturaen som utstedes til organisasjonen din. Alle enheter du kjøper, vil være aktive frem til starten av neste fakturaperiode og fornyes daglig etter det.

Hvordan aktiverer jeg kall til å bruke token fra Skaleringsnivå?

Du må slå på bryteren Scale Tier Enabled under Prosjektinnstillinger.

Hvis du bruker Completions API, kan du også se dokumentasjonen vår som forklarer nøkkelen service_tier, for å avgjøre om du bør angi den manuelt eller bruke standardatferden.

Kall til Responses API bruker service_tier=auto som standard. Hvis et prosjekt har Scale Tier Enabled, vil forespørsler som utelater service_tier (eller bruker auto), bruke Skaleringsnivå som standard når Skaleringsnivå-kvote er tilgjengelig. Forespørsler med service_tier=default vil bruke delt/PAYG-beregningskapasitet.

Hvordan kan jeg se kjøpshistorikken min og utløpte token?

Du kan se kjøpshistorikken for Skaleringsnivå på Skaleringsnivå-siden ved å velge en modell under Klargjorte token.

Provisioned tokens table with active allocations for gpt-4o and gpt-4o-mini

Når du har valgt en modell, kan du se Utløpte token og Tidligere transaksjoner nederst på siden.

Image

Hvordan kan jeg redigere tokenkapasiteten min?

Du kan redigere tokenkapasiteten for en modell ved å velge en modell under Klargjorte token på Skaleringsnivå-siden. Når du har valgt en modell, finner du kjøpet ditt under overskriften Aktiv og velger Avbryt ved siden av kjøpet for å redigere det

Image

I dialogvinduet kan du angi antallet enheter som skal kanselleres direkte, eller bruke glidebryteren til å modellere TPM mens du gjør valget.

Edit Token Capacity dialog for gpt-4o canceling 1 package and reducing output limit TPM from 2.248M to 2.246M

Hvordan kan jeg se RPM/TPM og bruken for Skaleringsnivå?

Du kan se et sammendrag av API-bruken for organisasjonen på Skaleringsnivå-siden. Alle datoer og klokkeslett er basert på UTC, og data kan være opptil 5 minutter forsinket.

Input token usage chart for the last 30 days with several spikes and a peak near 700K

Du kan se gjennom bruken din i kontrollpanelet for aktivitetsbruk ved å velge Skaleringsnivå-modellene dine i rullegardinmenyen for modeller. Du kan vise disse dataene i vinduer på 30 dager, 1 dag og 15 minutter. Bruksdataene dine er stablet for å vise hvor mye bruk som dekkes av modellen på Skaleringsnivå, sammenlignet med hvor mye bruk som dekkes av kontoabonnementet ditt.

Vær oppmerksom på at bare organisasjonseiere kan se kontrollpanelet for bruk.

Når blir endringen i tokenkapasitet synlig i kontrollpanelet for bruk?

Det kan ta opptil 24 timer før endringene du gjør, vises. Selve endringene trer i kraft nesten umiddelbart.

Var denne artikkelen nyttig?