OpenAI
页面内容为机器翻译。查看英文原文

优先处理常见问题

关于优先处理的常见问题解答

更新于:13 days ago

我们现为希望在特定模型上获得更快、更稳定性能的企业版 API 客户提供优先处理服务。以下是关于其工作方式、定价、模型可用性、速率限制、可靠性、政策与资格等常见问题的解答。

了解更多请点击此处

访问

谁可以使用优先处理?

优先处理目前面向企业版客户开放。

所有地区都提供优先处理吗?

优先处理的可用性取决于各司法辖区适用的法律法规。如对您所在地区的可用性有疑问,请联系您的客户总监。

定价

如何开始使用优先处理?

客户可在每次请求级别通过现有的 service_tier 参数将流量定向到优先处理,选项为 service_tier="priority"

这与 Scale Tier 如何交互?

Scale Tier 将与优先处理保持独立。发送到优先处理的请求将单独计费,且不会计入您已购买的 Scale Tier TPM 套餐。

我可以将 Scale Tier 的溢出流量自动发送到优先处理吗?

不可以。发送到 Scale Tier 的流量不会自动溢出到优先处理。

优先处理如何计费?

由优先处理服务的 token 将按 token 计费,价格相较标准处理费率为溢价。

我的年度承诺是否绑定到某种处理模式?

不绑定。所有处理模式都会计入您的企业版年度支出承诺。

缓存输入 token 仍然有折扣吗?

是的!缓存输入与标准处理相同,仍可享受 50–75% 的折扣。

如何查看优先处理的用量与支出?

要查看由优先处理处理的 token,请前往用量(Usage)仪表板,选择 Chat Completions 或 Responses,并按 Service Tier 分组。要查看优先处理成本,请前往用量(Usage)仪表板,并选择按 Line Item 分组。

模型

长上下文、微调模型、embedding 等支持优先处理吗?

目前不支持。未来我们将评估是否在最新模型之外的更多产品上提供优先处理。

其他模态如何与优先处理配合使用?

优先处理支持与标准处理相同的多模态能力。尤其是,图像可作为优先处理的输入,并以同样的低延迟进行处理。

未来的模型会被支持吗?

我们计划在新的 GPT 模型上提供优先处理,但不保证每个模型都会被支持。

速率限制

速率限制是多少?

在速率限制方面,优先处理的消耗与标准 API 流量一视同仁。

什么是爬坡速率限制?

优先处理设有爬坡速率限制,以在仍提供灵活按需定价的同时,确保所有客户持续获得高性能。如果 (a) 优先处理性能下降,且 (b) 某客户的流量爬坡过快,那么在极少数情况下,部分优先处理请求可能会被降级为标准处理。

当前优先处理的爬坡速率限制在我们的主要文档中定义,见此处

保持在爬坡速率限制内的最佳实践

  • 在切换模型时逐步增加流量。例如,如果您的应用正从旧快照迁移到新快照,请使用功能开关在数小时内逐步切换流量,而不是一次性全部切换。

  • 避免在优先处理上运行大规模数据处理或异步作业。这些作业可能会非常快地拉升流量,而且通常并不需要优先处理带来的性能提升。

  • 如果您经常触发爬坡速率限制,请考虑改为购买 Scale tier 配额。

爬坡速率限制是否在我的项目或组织之间共享?

是的,您的所有流量都会计入同一个爬坡速率限制。

政策

如果优先处理未达到延迟目标,会发生什么?

如有任何问题或疑虑,请联系您的 AD。优先处理的 SLA 将与 Scale Tier SLA 同等对待;若我们在某一时间窗口内未能为企业协议客户满足这些 SLA,将提供服务抵扣。

优先处理与数据驻留(Data Residency)兼容吗?

是的。

优先处理与 ZDR 和 BAA 兼容吗?

是的。

这篇文章对你有帮助吗?