OpenAI
Ta strona została przetłumaczona maszynowo. Wyświetl oryginalny artykuł w języku angielskim.

Platforma API — oferta Skalowana dla obecnych klientów Enterprise

Zaktualizowano: 4 days ago

Oferta Skalowana na platformie API umożliwia zakup z góry określonej liczby wejściowych i wyjściowych tokenów API na minutę (tzw. „jednostek tokenów”), aby uzyskać dostęp do jednej dedykowanej migawki modelu. Każdą jednostkę tokenów kupuje się na co najmniej 30 dni.

Po podpisaniu formularza zamówienia możesz dodawać i usuwać jednostki tokenów na swoim koncie platformy API. Uwaga: tylko właściciele organizacji i upoważnieni użytkownicy mogą wyświetlać ustawienia oferty Skalowanej oraz kupować jednostki tokenów wejściowych i wyjściowych.


Dowiedz się więcej o cenach w ofercie Skalowanej.

Jak uzyskać dostęp do ustawień oferty Skalowanej?

Właściciele organizacji na platformie API mogą przejść do ustawień oferty Skalowanej, wybierając ikonę koła zębatego ustawień w prawym górnym rogu strony, a następnie opcję „Oferta Skalowana” w sekcji „Organizacja” w menu po lewej stronie ekranu.

Image

Strona ustawień oferty Skalowanej umożliwia dodawanie przepustowości, wyświetlanie użycia tokenów wejściowych, planowanie przepustowości, przeglądanie przydzielonych tokenów i sprawdzanie upoważnionych kupujących.

Jak mogę kupić większą przepustowość?

Możesz kupić przepustowość, wybierając przycisk „Dodaj przepustowość” w prawym górnym rogu strony oferty Skalowanej. Najbardziej aktualne informacje o uprawnieniach TPM przypadających na jednostki tokenów wejściowych i wyjściowych znajdziesz na naszej głównej stronie oferty Skalowanej.

Po wybraniu typu tokenów do zakupu możesz wpisać ich liczbę bezpośrednio albo przesunąć suwak, aby wybrać liczbę tokenów, którą chcesz kupić. Suwak ułatwia śledzenie zmian TPM w sekcji Podsumowanie podczas zmiany liczby tokenów. Podamy też rekomendowaną liczbę jednostek do zakupu, która pokryje ruch z ostatnich 30 dni.

Add token capacity dialog for gpt-4o with Input Tokens selected and input limit increasing from 40K to 60K

Po sfinalizowaniu wyboru wybierz „Przejdź do kasy”, aby potwierdzić zakup w następnym oknie modalnym.

Uwaga: ceny widoczne w podsumowaniu to nasze standardowe stawki i nie obejmują rabatów wynegocjowanych w formularzu zamówienia Twojej organizacji. Wszelkie obowiązujące rabaty zostaną zastosowane i uwzględnione na fakturze wystawionej Twojej organizacji. Wszystkie zakupione jednostki będą aktywne do początku następnego okresu rozliczeniowego, a potem będą odnawiać się codziennie.

Jak włączyć używanie tokenów oferty Skalowanej w wywołaniach?

Musisz włączyć przełącznik Scale Tier Enabled w Ustawieniach projektu.

Jeśli korzystasz z interfejsu API Completions, zapoznaj się też z naszą dokumentacją wyjaśniającą klucz service_tier, aby zdecydować, czy ustawić go ręcznie, czy zdać się na działanie domyślne.

Wywołania interfejsu API Responses domyślnie używają service_tier=auto. Jeśli w projekcie włączono Scale Tier Enabled, żądania bez service_tier (lub z wartością auto) będą domyślnie korzystać z oferty Skalowanej, gdy dostępny jest jej limit. Żądania z service_tier=default będą korzystać ze współdzielonych zasobów obliczeniowych/PAYG.

Jak wyświetlić historię zakupów i wygasłe tokeny?

Historię zakupów oferty Skalowanej możesz wyświetlić na stronie oferty Skalowanej, wybierając model w sekcji Przydzielone tokeny.

Provisioned tokens table with active allocations for gpt-4o and gpt-4o-mini

Po wybraniu modelu u dołu strony zobaczysz sekcje „Wygasłe tokeny” i „Wcześniejsze transakcje”.

Image

Jak mogę edytować przepustowość tokenów?

Możesz edytować przepustowość tokenów modelu, wybierając model w sekcji Przydzielone tokeny na stronie oferty Skalowanej. Po wybraniu modelu odszukaj zakup pod nagłówkiem „Aktywne” i wybierz „Anuluj” obok zakupu, aby go edytować

Image

W oknie modalnym możesz wpisać bezpośrednio liczbę jednostek do anulowania albo użyć suwaka, aby zobaczyć wpływ wyboru na TPM.

Edit Token Capacity dialog for gpt-4o canceling 1 package and reducing output limit TPM from 2.248M to 2.246M

Jak wyświetlić RPM/TPM i użycie w ofercie Skalowanej?

Podsumowanie użycia API dla swojej organizacji możesz zobaczyć na stronie oferty Skalowanej. Wszystkie daty i godziny są oparte na UTC, a dane mogą być opóźnione o maksymalnie 5 minut.

Input token usage chart for the last 30 days with several spikes and a peak near 700K

Użycie możesz sprawdzić w panelu użycia aktywności, wybierając modele oferty Skalowanej z listy rozwijanej modeli. Możesz wyświetlać te dane w oknach 30-dniowym, 1-dniowym i 15-minutowym. Dane użycia są przedstawione w układzie skumulowanym, pokazując użycie modelu objęte ofertą Skalowaną na tle użycia objętego planem konta.

Uwaga: panel użycia mogą wyświetlać tylko właściciele organizacji.

Kiedy zmiana przepustowości tokenów będzie widoczna w panelu użycia?

Wprowadzone zmiany mogą być widoczne dopiero po maksymalnie 24 godzinach. Same zmiany zaczną obowiązywać niemal natychmiast.

Czy ten artykuł był pomocny?