OpenAI
此頁面由機器翻譯。查看原文英文文章

API 平台 - 適用於現有企業客戶的規模層級

更新日期:8 hours ago

API 平台上的規模層級可讓你預先購買固定數量的每分鐘 API 輸入及輸出 Token(稱為「Token 單位」),以存取一個專用模型快照。每個 Token 單位的最低購買期為 30 天。

簽署訂單表格後,你可以透過你的 API 平台帳戶新增和移除 Token 單位。請注意,只有組織擁有者和獲授權用戶可以查看規模層級設定,以及購買輸入和輸出 Token 單位。


進一步了解規模層級的定價。

如何存取我的規模層級設定?

API 平台組織擁有者可以選擇頁面右上角的設定齒輪,然後在畫面左側選單的「組織」區段下選擇規模層級,以存取其規模層級設定。

Image

規模層級設定頁面可讓你新增更多容量、查看輸入 Token 使用量、規劃容量、查看已佈建 Token,以及檢視獲授權購買者。

如何購買更多容量?

你可以在規模層級頁面右上角選擇「新增容量」按鈕來購買容量。請參閱我們的規模層級主頁,了解每個輸入及輸出 Token 單位的 TPM 額度最新詳情。

選擇要購買的 Token 類型後,你可以直接輸入數量,或移動滑桿來選擇要購買的 Token 數量。滑桿可讓你在調整 Token 數量時,輕鬆查看「摘要」中的 TPM 變化。我們亦會根據你過去 30 天的流量,建議應購買的單位數量。

Add token capacity dialog for gpt-4o with Input Tokens selected and input limit increasing from 40K to 60K

完成選擇後,選擇「結帳」以在下一個彈出視窗中確認購買。

請注意,我們在摘要中顯示的價格為標準費率,並不包括你組織在訂單表格中協議的任何折扣。任何適用折扣都會套用,並反映在發給你組織的發票中。所購買的任何單位將在下一個發票期開始前生效,其後每日續期。

如何啟用呼叫以使用規模層級 Token?

你需要在「專案設定」中將 Scale Tier Enabled 切換開關設為開啟。

如果你使用 Completions API,亦請參閱我們說明 service_tier 鍵的文件,以決定應否手動設定,或依賴預設行為。

對 Responses API 的呼叫預設為 service_tier=auto。如果專案已啟用 Scale Tier Enabled,在規模層級配額可用時,省略 service_tier(或使用 auto)的請求預設會使用規模層級。使用 service_tier=default 的請求會使用共享/PAYG 運算。

如何查看我的購買記錄和已過期 Token?

你可以在規模層級頁面的「已佈建 Token」下選擇一個模型,以查看你的規模層級購買記錄。

Provisioned tokens table with active allocations for gpt-4o and gpt-4o-mini

選擇模型後,你便可在頁面底部查看「已過期 Token」和「過往交易」。

Image

如何編輯我的 Token 容量?

你可以在規模層級頁面的「已佈建 Token」下選擇一個模型,以編輯該模型的 Token 容量。選擇模型後,在「有效」標題下找到你的購買項目,然後選擇購買項目旁的「取消」以進行編輯

Image

在彈出視窗中,你可以直接輸入要取消的單位數量,或使用滑桿在選擇時模擬 TPM。

Edit Token Capacity dialog for gpt-4o canceling 1 package and reducing output limit TPM from 2.248M to 2.246M

如何查看我的規模層級 RPM/TPM 和使用量?

你可以在規模層級頁面查看你組織的 API 使用量摘要。所有日期和時間均以 UTC 為基準,數據最多可能延遲 5 分鐘。

Input token usage chart for the last 30 days with several spikes and a peak near 700K

你可以在「模型」下拉式選單中選擇你的規模層級模型,於活動使用量儀表板查看使用量。你可以按 30 天、1 天和 15 分鐘的時段查看此數據。你的使用量數據會以堆疊方式顯示,對比由規模層級涵蓋的模型使用量,以及由你帳戶方案涵蓋的使用量。

請注意,只有組織擁有者可以查看使用量儀表板。

Token 容量的變更何時會反映在使用量儀表板中?

你所作的變更最多可能需要 24 小時才會反映出來。變更本身會幾乎即時生效。

這篇文章對你有幫助嗎?