OpenAI

API プラットフォーム - 既存のエンタープライズ顧客向けスケールティア

更新日: yesterday

API プラットフォームのスケールティアでは、1つの専用モデルスナップショットへのアクセスのために、1分あたりの API 入力トークンおよび出力トークンの所定量(「トークン単位」)を前払いで購入できます。各トークン単位は、最低30日間から購入できます。

注文書に署名すると、API プラットフォームアカウントからトークン単位の追加・削除ができます。スケールティアの設定を表示したり、入力トークンおよび出力トークンのトークン単位を購入したりできるのは、組織のオーナーと権限を付与されたユーザーのみですのでご注意ください。

スケールティアの料金体系について詳しくはこちらをご覧ください。

スケールティア設定にアクセスするにはどうすればよいですか?

API プラットフォーム組織のオーナーは、ページ右上の設定アイコンを選択し、画面左側のメニューの「組織」セクションにある「スケールティア」を選択することで、スケールティアの設定にアクセスできます。

Image

スケールティア設定ページでは、容量の追加、入力トークンの使用状況の確認、容量計画、プロビジョニング済みトークンの確認、承認済み購入者の確認を行うことができます。

追加の容量を購入するにはどうすればよいですか?

容量を追加するには、スケールティアページの右上にある「容量を追加」ボタンを選択してください。入力および出力トークン単位ごとの TPM 利用枠に関する最新情報は、スケールティアのメインページをご覧ください。

購入するトークンの種類を選択した後、数量を直接入力するか、スライダーを動かして購入するトークンの数を選択できます。スライダーを使用すると、トークンを変更する際に「概要」の下で TPM の変更を簡単に確認できます。また、直近30日間のトラフィックに対応するために購入すべきユニット数の推奨値も提示します。

Add token capacity dialog for gpt-4o with Input Tokens selected and input limit increasing from 40K to 60K

選択内容が決まったら、次のモーダルで「チェックアウト」を選択して購入を確定してください。

記載されている価格は弊社の標準料金であり、貴社の注文書で交渉された割引は含まれておりませんのでご注意ください。適用可能な割引はすべて適用され、貴社に発行される請求書に反映されます。購入されたユニットは、次回の請求期間の開始まで有効で、その後は毎日更新されます。

呼び出しでスケールティアのトークンを使用するにはどうすればよいですか?

プロジェクト設定の「スケールティアの有効化」トグルをオンにする必要があります。

Completions API をご利用の場合は、ドキュメントservice_tier キーについてご確認いただき、手動で設定すべきか、デフォルトの動作に任せるべきかを判断してください。

Responses API への呼び出しでは、デフォルトで service_tier=auto が使用されます。プロジェクトでスケールティアが有効になっている場合、service_tier を省略した(または auto を使用した)リクエストは、スケールティアの割り当てが利用可能な場合に、デフォルトでスケールティアを使用します。service_tier=default を指定したリクエストでは、共有コンピューティングまたは従量課金制のコンピューティングが使用されます。

購入履歴と期限切れのトークンを確認するにはどうすればよいですか?

「プロビジョニング済みトークン」の下にあるモデルを選択すると、スケールティアページで購入履歴を確認できます。

Provisioned tokens table with active allocations for gpt-4o and gpt-4o-mini

モデルを選択すると、ページ下部に有効期限切れのトークンと過去の取引履歴が表示されます。

Image

トークン容量を編集するにはどうすればよいですか?

スケールティアページの「プロビジョニング済みトークン」でモデルを選択することで、モデルのトークン容量を編集できます。モデルを選択したら、「アクティブ」ヘッダーの下にある購入項目を見つけて、その横にある「キャンセル」を選択して編集します。

Image

モーダルでは、キャンセルするユニット数を直接入力するか、スライダーを使用して選択を行いながらTPMをモデル化することができます。

Edit Token Capacity dialog for gpt-4o canceling 1 package and reducing output limit TPM from 2.248M to 2.246M

スケールティアの RPM/TPM と使用状況を確認するにはどうすればよいですか?

組織の API 使用状況の概要はスケールティアページで確認できます。すべての日付と時刻はUTC(協定世界時)に基づいており、データには最大5分の遅れが生じる場合があります。

Input token usage chart for the last 30 days with several spikes and a peak near 700K

モデルのドロップダウンでスケールティアのモデルを選択すると、アクティビティ使用状況ダッシュボードで使用状況を確認できます。このデータは、30日、1日、15分の時間枠で確認できます。使用状況データは積み上げ形式で表示され、スケールティアの対象となるモデルの使用量と、アカウントプランの対象となる使用量を示します。

組織の所有者のみが使用状況ダッシュボードを閲覧できます。

トークン容量の変更が利用状況ダッシュボードに反映されるのはいつですか?

変更内容が反映されるまで最大24時間かかる場合があります。変更自体はほぼ即座に発効します。

この記事は役に立ちましたか?