OpenAI

API 平台 - 针对现有企业客户的规模层级

更新于:8 days ago

API 平台中的规模层级允许你预先购买特定数量的每分钟 API 输入和输出 Token(称为“Token 单元”),以访问专属模型快照。每个 Token 单元的购买期限最少为 30 天。

签署订单后,你可以通过 API 平台帐户添加和移除 Token 单元。请注意,只有组织所有者和授权用户才能查看规模层级设置,并购买输入和输出 Token 单元。

了解更多关于规模层级的定价信息。

如何访问我的规模层级设置?

API 平台组织所有者可以选择页面右上角的“设置”齿轮图标,然后在界面左侧菜单的“组织”模块下选择“规模层级”,访问其规模层级设置。

Image

规模层级设置页面允许你增加容量、查看输入 Token 用量、规划容量、查看预配 Token,并审核授权购买者。

如何购买更多容量?

你可以点击规模层级页面右上角的“添加容量”按钮来购买容量。请参阅我们的规模层级主页,了解每个输入和输出 Token 单元对应 TPM 授权额度的最新详情。

选择要购买的 Token 类型后,你可以直接输入数量,或者移动滑块选择要购买的 Token 数量。你可以借助滑块,在调整 Token 数量时,轻松查看“摘要”下的 TPM 变化。我们还将提供关于单元数量的购买建议,以覆盖你过去 30 天的流量。

Add token capacity dialog for gpt-4o with Input Tokens selected and input limit increasing from 40K to 60K

确定后,请选择“结账”,以便在下一个弹窗中确认购买。

请注意,“摘要”中显示的价格为标准费率,不包含组织在订购单中协商获取的任何折扣。任何适用的折扣都会自动应用,并在向组织开具的发票中同步显示。所购单元的有限期截至下一个发票周期,之后将按日续订。

如何启用调用以使用规模层级 Token?

你需要在“项目设置”中将“规模层级已启用”开关切换为开启状态。

如果你正在使用 Completions API,请参阅我们的文档,了解 service_tier 键的定义,以便决定是手动设置还是依赖默认行为。

对 Responses API 的调用默认为 service_tier=auto。如果项目已启用规模层级,则在规模层级配额可用时,省略 service_tier(或使用 auto)的请求将默认使用规模层级。service_tier=default 的请求将使用共享/PAYG 计算资源。

如何查看我的购买记录和已过期的 Token?

你可以在规模层级页面中的“预配 Token”下选择一个模型,查看规模层级购买记录。

Provisioned tokens table with active allocations for gpt-4o and gpt-4o-mini

选择模型后,你可以在页面底部查看已过期的 Token 和历史交易。

Image

如何修改我的 Token 容量?

你可以在规模层级页面的“预配 Token”下选择一个模型,以编辑该模型的 Token 容量。选择模型后,在“活跃”标题下找到购买项,然后选择购买项旁的“取消”以进行编辑

Image

你可以在弹窗中直接输入要取消的单元数量,或者在选择时使用滑块调整对应的 TPM。

Edit Token Capacity dialog for gpt-4o canceling 1 package and reducing output limit TPM from 2.248M to 2.246M

如何查看我的规模层级 RPM/TPM 及使用情况?

你可以在规模层级页面中查看组织的 API 用量摘要。所有日期和时间均以 UTC 时区为准,数据最多可能延迟 5 分钟。

Input token usage chart for the last 30 days with several spikes and a peak near 700K

你可以在活动用量控制面板中查看用量,具体方法是在模型下拉菜单中选择规模层级模型。你可以按 30 天、1 天和 15 分钟的时间段查看相应数据。你的用量数据以堆叠形式显示,用于对比规模层级所覆盖的模型用量与帐户套餐所覆盖的用量。

请注意,只有组织所有者才能查看用量控制面板。

我的 Token 容量变更何时会在用量控制面板中显示?

你所做的更改最多可能需要 24 小时才会同步。这些更改本身会即时生效。

这篇文章对你有帮助吗?