OpenAI
Ta strona została przetłumaczona maszynowo. Wyświetl oryginalny artykuł w języku angielskim.

Platforma API — oferta Skalowana dla obecnych klientów korporacyjnych

Zaktualizowano: 3 days ago

Oferta Skalowana na Platformie API umożliwia zakup z góry określonej liczby wejściowych i wyjściowych tokenów API na minutę (zwanych „jednostkami tokenów”) w celu uzyskania dostępu do jednego dedykowanego snapshota modelu. Każda jednostka tokenów jest kupowana na minimum 30 dni.

Po podpisaniu formularza zamówienia możesz dodawać i usuwać jednostki tokenów przez swoje konto Platformy API. Pamiętaj, że tylko właściciele organizacji i upoważnieni użytkownicy mogą przeglądać ustawienia oferty Skalowanej oraz kupować jednostki wejściowych i wyjściowych tokenów.

Dowiedz się więcej o cenach w ofercie Skalowanej.

Jak uzyskać dostęp do ustawień oferty Skalowanej?

Właściciele organizacji na Platformie API mogą uzyskać dostęp do ustawień oferty Skalowanej, wybierając ikonę Ustawień w prawym górnym rogu strony, a następnie pozycję Scale Tier w sekcji "Organization" w menu po lewej stronie ekranu.

Image

Strona ustawień oferty Skalowanej pozwala dodać większą przepustowość, wyświetlić użycie tokenów wejściowych, planować przepustowość, sprawdzać przydzielone tokeny i przeglądać listę autoryzowanych nabywców.

Jak kupić większą przepustowość?

Możesz kupić przepustowość, wybierając przycisk Add capacity w prawym górnym rogu strony oferty Skalowanej. Zobacz naszą główną stronę oferty Skalowanej, aby poznać najnowsze informacje o uprawnieniach TPM dla wejściowych i wyjściowych jednostek tokenów.

Po wybraniu typu tokenów, które chcesz kupić, możesz bezpośrednio wpisać ilość albo przesunąć suwak, aby wybrać liczbę tokenów do zakupu. Suwak pozwala łatwo zobaczyć zmiany TPM w sekcji Summary podczas zmiany liczby tokenów. Przedstawimy też rekomendację liczby jednostek do zakupu, aby pokryć ruch z ostatnich 30 dni.

Add token capacity dialog for gpt-4o with Input Tokens selected and input limit increasing from 40K to 60K

Gdy zakończysz wybór, kliknij Checkout, aby potwierdzić zakup w następnym oknie modalnym.

Pamiętaj, że ceny pokazane w naszym podsumowaniu są standardowymi stawkami i nie obejmują żadnych rabatów wynegocjowanych w formularzu zamówienia Twojej organizacji. Wszelkie obowiązujące rabaty zostaną zastosowane i uwzględnione na fakturze wystawionej Twojej organizacji. Wszystkie zakupione jednostki będą aktywne do początku następnego okresu rozliczeniowego, a potem będą odnawiane codziennie.

Jak włączyć wywołania korzystające z tokenów oferty Skalowanej?

Musisz włączyć przełącznik Scale Tier Enabled w ustawieniach projektu.

Jeśli używasz Completions API, zapoznaj się także z naszą dokumentacją wyjaśniającą klucz service_tier, aby zdecydować, czy ustawić go ręcznie, czy polegać na zachowaniu domyślnym.

Wywołania do Responses API domyślnie używają service_tier=auto. Jeśli projekt ma włączone ustawienie Scale Tier Enabled, żądania, które pomijają service_tier (lub używają auto), będą domyślnie korzystać z oferty Skalowanej, gdy dostępny jest limit oferty Skalowanej. Żądania z service_tier=default będą korzystać ze współdzielonej mocy obliczeniowej/PAYG.

Jak wyświetlić historię zakupów i wygasłe tokeny?

Możesz wyświetlić historię zakupów oferty Skalowanej na stronie oferty Skalowanej, wybierając model w sekcji Provisioned tokens.

Provisioned tokens table with active allocations for gpt-4o and gpt-4o-mini

Po wybraniu modelu zobaczysz na dole strony sekcje Expired tokens oraz Prior transactions.

Image

Jak edytować pojemność tokenów?

Możesz edytować pojemność tokenów modelu, wybierając model w sekcji Provisioned tokens na stronie oferty Skalowanej. Po wybraniu modelu znajdź swój zakup pod nagłówkiem Active i wybierz Cancel obok zakupu, aby go edytować

Image

W oknie modalnym możesz bezpośrednio wpisać liczbę jednostek do anulowania albo użyć suwaka, aby modelować TPM podczas dokonywania wyboru.

Edit Token Capacity dialog for gpt-4o canceling 1 package and reducing output limit TPM from 2.248M to 2.246M

Jak wyświetlić RPM/TPM oferty Skalowanej i użycie?

Możesz wyświetlić podsumowanie użycia API dla swojej organizacji na stronie oferty Skalowanej. Wszystkie daty i godziny są oparte na UTC, a dane mogą być opóźnione do 5 minut.

Input token usage chart for the last 30 days with several spikes and a peak near 700K

Możesz sprawdzić swoje użycie na pulpicie Activity Usage Dashboard, wybierając modele oferty Skalowanej z listy rozwijanej modeli. Dane te możesz oglądać w oknie 30 dni, 1 dnia i 15 minut. Dane użycia są prezentowane warstwowo, aby pokazać ilość użycia modelu pokrywaną przez ofertę Skalowaną względem ilości użycia pokrywanej przez plan konta.

Pamiętaj, że tylko właściciele organizacji mogą wyświetlać Usage Dashboard.

Kiedy zmiana pojemności tokenów będzie widoczna na pulpicie użycia?

Odzwierciedlenie wprowadzonych zmian może potrwać do 24 godzin. Same zmiany zaczną obowiązywać niemal natychmiast.

Czy ten artykuł był pomocny?