API 平台上的規模層級可讓你預先購買固定數量的每分鐘 API 輸入及輸出 Token(稱為「Token 單位」),以存取一個專用模型快照。每個 Token 單位的最低購買期為 30 天。
簽署訂單表格後,你可以透過你的 API 平台帳戶新增和移除 Token 單位。請注意,只有組織擁有者和獲授權用戶可以查看規模層級設定,以及購買輸入和輸出 Token 單位。
進一步了解規模層級的定價。
如何存取我的規模層級設定?
API 平台組織擁有者可以選擇頁面右上角的設定齒輪,然後在畫面左側選單的「組織」區段下選擇規模層級,以存取其規模層級設定。
規模層級設定頁面可讓你新增更多容量、查看輸入 Token 使用量、規劃容量、查看已佈建 Token,以及檢視獲授權購買者。
如何購買更多容量?
你可以在規模層級頁面右上角選擇「新增容量」按鈕來購買容量。請參閱我們的規模層級主頁,了解每個輸入及輸出 Token 單位的 TPM 額度最新詳情。
選擇要購買的 Token 類型後,你可以直接輸入數量,或移動滑桿來選擇要購買的 Token 數量。滑桿可讓你在調整 Token 數量時,輕鬆查看「摘要」中的 TPM 變化。我們亦會根據你過去 30 天的流量,建議應購買的單位數量。
完成選擇後,選擇「結帳」以在下一個彈出視窗中確認購買。
請注意,我們在摘要中顯示的價格為標準費率,並不包括你組織在訂單表格中協議的任何折扣。任何適用折扣都會套用,並反映在發給你組織的發票中。所購買的任何單位將在下一個發票期開始前生效,其後每日續期。
如何啟用呼叫以使用規模層級 Token?
你需要在「專案設定」中將 Scale Tier Enabled 切換開關設為開啟。
如果你使用 Completions API,亦請參閱我們說明 service_tier 鍵的文件,以決定應否手動設定,或依賴預設行為。
對 Responses API 的呼叫預設為 service_tier=auto。如果專案已啟用 Scale Tier Enabled,在規模層級配額可用時,省略 service_tier(或使用 auto)的請求預設會使用規模層級。使用 service_tier=default 的請求會使用共享/PAYG 運算。
如何查看我的購買記錄和已過期 Token?
你可以在規模層級頁面的「已佈建 Token」下選擇一個模型,以查看你的規模層級購買記錄。
選擇模型後,你便可在頁面底部查看「已過期 Token」和「過往交易」。
如何編輯我的 Token 容量?
你可以在規模層級頁面的「已佈建 Token」下選擇一個模型,以編輯該模型的 Token 容量。選擇模型後,在「有效」標題下找到你的購買項目,然後選擇購買項目旁的「取消」以進行編輯
在彈出視窗中,你可以直接輸入要取消的單位數量,或使用滑桿在選擇時模擬 TPM。
如何查看我的規模層級 RPM/TPM 和使用量?
你可以在規模層級頁面查看你組織的 API 使用量摘要。所有日期和時間均以 UTC 為基準,數據最多可能延遲 5 分鐘。
你可以在「模型」下拉式選單中選擇你的規模層級模型,於活動使用量儀表板查看使用量。你可以按 30 天、1 天和 15 分鐘的時段查看此數據。你的使用量數據會以堆疊方式顯示,對比由規模層級涵蓋的模型使用量,以及由你帳戶方案涵蓋的使用量。
請注意,只有組織擁有者可以查看使用量儀表板。
Token 容量的變更何時會反映在使用量儀表板中?
你所作的變更最多可能需要 24 小時才會反映出來。變更本身會幾乎即時生效。
