OpenAI
หน้านี้แปลด้วยระบบอัตโนมัติ ดูต้นฉบับภาษาอังกฤษ.

API Platform - ระดับการรองรับการใช้งานสำหรับลูกค้าองค์กรปัจจุบัน

อัปเดตล่าสุด: yesterday

ระดับการรองรับการใช้งานบน API Platform ช่วยให้คุณซื้อโทเค็นอินพุตและเอาต์พุตของ API จำนวนหนึ่งต่อนาที (เรียกว่า “หน่วยโทเค็น”) ล่วงหน้า เพื่อเข้าถึงสแนปช็อตโมเดลเฉพาะหนึ่งรายการ หน่วยโทเค็นแต่ละหน่วยต้องซื้อขั้นต่ำ 30 วัน

เมื่อคุณลงนามในแบบฟอร์มคำสั่งซื้อแล้ว คุณสามารถเพิ่มและลบหน่วยโทเค็นผ่าน บัญชี API Platform ของคุณได้ โปรดทราบว่าเฉพาะเจ้าขององค์กรและผู้ใช้ที่ได้รับอนุญาตเท่านั้นที่ดูการตั้งค่าระดับการรองรับการใช้งานและซื้อหน่วยโทเค็นอินพุตและเอาต์พุตได้


ดูข้อมูลเพิ่มเติมเกี่ยวกับราคาของระดับการรองรับการใช้งาน

ฉันจะเข้าถึงการตั้งค่าระดับการรองรับการใช้งานได้อย่างไร

เจ้าขององค์กรใน API Platform สามารถเข้าถึงการตั้งค่าระดับการรองรับการใช้งานของตนได้โดยเลือกไอคอนรูปเฟืองการตั้งค่าที่มุมขวาบนของหน้า แล้วเลือกระดับการรองรับการใช้งานใต้ส่วน “องค์กร” ในเมนูทางซ้ายของหน้าจอ

Image

หน้าการตั้งค่าระดับการรองรับการใช้งานช่วยให้คุณเพิ่มความจุ ดูการใช้โทเค็นอินพุต วางแผนความจุ ดูโทเค็นที่จัดสรรไว้ และตรวจสอบผู้ซื้อที่ได้รับอนุญาตของคุณ

ฉันจะซื้อความจุเพิ่มเติมได้อย่างไร

คุณสามารถซื้อความจุได้โดยเลือกปุ่ม Add capacity ที่มุมขวาบนของหน้า ระดับการรองรับการใช้งาน ของคุณ โปรดดูหน้าหลักของระดับการรองรับการใช้งานของเรา เพื่อดูรายละเอียดล่าสุดเกี่ยวกับปริมาณ TPM ที่ได้รับต่อหน่วยโทเค็นอินพุตและเอาต์พุต

หลังจากเลือกประเภทโทเค็นที่จะซื้อแล้ว คุณสามารถป้อนจำนวนโดยตรงหรือเลื่อนแถบเลื่อนเพื่อเลือกจำนวนโทเค็นที่ต้องการซื้อ แถบเลื่อนช่วยให้คุณดูการเปลี่ยนแปลง TPM ในส่วน Summary ได้ง่ายขณะปรับจำนวนโทเค็น เราจะให้คำแนะนำเกี่ยวกับจำนวนหน่วยที่ควรซื้อเพื่อรองรับปริมาณการใช้งานของคุณในช่วง 30 วันที่ผ่านมา

Add token capacity dialog for gpt-4o with Input Tokens selected and input limit increasing from 40K to 60K

เมื่อเลือกเสร็จแล้ว ให้เลือก Checkout เพื่อยืนยันการซื้อในหน้าต่างโมดัลถัดไป

โปรดทราบว่าราคาที่แสดงในสรุปของเราเป็นอัตรามาตรฐาน และไม่รวมส่วนลดใดๆ ที่เจรจาไว้ในแบบฟอร์มคำสั่งซื้อขององค์กรคุณ ส่วนลดที่เกี่ยวข้องจะถูกนำไปใช้และแสดงในใบแจ้งหนี้ที่ออกให้องค์กรของคุณ หน่วยใดๆ ที่ซื้อจะใช้งานได้จนถึงช่วงเริ่มต้นของรอบใบแจ้งหนี้ถัดไป และจะต่ออายุเป็นรายวันหลังจากนั้น

ฉันจะเปิดใช้งานการเรียก API ให้ใช้โทเค็นของระดับการรองรับการใช้งานได้อย่างไร

คุณต้องเปิดสวิตช์ Scale Tier Enabled ใน Project Settings

หากคุณใช้ Completions API โปรดดูเอกสารของเราที่อธิบายคีย์ service_tier เพิ่มเติม เพื่อพิจารณาว่าคุณควรตั้งค่าด้วยตนเองหรือใช้พฤติกรรมเริ่มต้น

การเรียก Responses API จะใช้ service_tier=auto เป็นค่าเริ่มต้น หากโปรเจ็กต์เปิดใช้ระดับการรองรับการใช้งาน คำขอที่ไม่ได้ระบุ service_tier (หรือใช้ auto) จะใช้ระดับการรองรับการใช้งานเป็นค่าเริ่มต้นเมื่อมีโควตาระดับการรองรับการใช้งานพร้อมใช้งาน คำขอที่มี service_tier=default จะใช้การประมวลผลแบบใช้ร่วมกัน/PAYG

ฉันจะดูประวัติการซื้อและโทเค็นที่หมดอายุได้อย่างไร

คุณสามารถดูประวัติการซื้อระดับการรองรับการใช้งานได้ในหน้า ระดับการรองรับการใช้งาน ของคุณ โดยเลือกโมเดลใต้ Provisioned tokens

Provisioned tokens table with active allocations for gpt-4o and gpt-4o-mini

เมื่อเลือกโมเดลแล้ว คุณจะสามารถดูโทเค็นที่หมดอายุและธุรกรรมก่อนหน้าได้ที่ด้านล่างของหน้า

Image

ฉันจะแก้ไขความจุโทเค็นได้อย่างไร

คุณสามารถแก้ไขความจุโทเค็นของโมเดลได้โดยเลือกโมเดลใต้ Provisioned tokens ในหน้า ระดับการรองรับการใช้งาน ของคุณ เมื่อเลือกโมเดลแล้ว ให้ค้นหาการซื้อของคุณใต้หัวข้อ Active แล้วเลือก Cancel ข้างการซื้อนั้นเพื่อแก้ไข

Image

ในหน้าต่างโมดัล คุณสามารถป้อนจำนวนหน่วยที่จะยกเลิกได้โดยตรง หรือใช้แถบเลื่อนเพื่อจำลอง TPM ระหว่างเลือก

Edit Token Capacity dialog for gpt-4o canceling 1 package and reducing output limit TPM from 2.248M to 2.246M

ฉันจะดู RPM/TPM และการใช้งานระดับการรองรับการใช้งานของฉันได้อย่างไร

คุณสามารถดูสรุปการใช้งาน API สำหรับองค์กรของคุณได้ในหน้า ระดับการรองรับการใช้งาน ของคุณ วันที่และเวลาทั้งหมดอิงตาม UTC และข้อมูลอาจล่าช้าได้สูงสุด 5 นาที

Input token usage chart for the last 30 days with several spikes and a peak near 700K

คุณสามารถตรวจสอบการใช้งานได้ในแดชบอร์ดการใช้งานตามกิจกรรม โดยเลือกโมเดลระดับการรองรับการใช้งานของคุณในเมนูดรอปดาวน์โมเดล คุณสามารถดูข้อมูลนี้ในกรอบเวลา 30 วัน, 1 วัน และ 15 นาที ข้อมูลการใช้งานของคุณจะแสดงแบบซ้อนกัน เพื่อเปรียบเทียบปริมาณการใช้งานของโมเดลที่ครอบคลุมโดยระดับการรองรับการใช้งานกับปริมาณการใช้งานที่ครอบคลุมโดยแผนบัญชีของคุณ

โปรดทราบว่าเฉพาะเจ้าขององค์กรเท่านั้นที่ดูแดชบอร์ดการใช้งานได้

เมื่อใดการเปลี่ยนแปลงความจุโทเค็นของฉันจึงจะแสดงในแดชบอร์ดการใช้งาน

การเปลี่ยนแปลงที่คุณทำอาจใช้เวลาสูงสุด 24 ชั่วโมงจึงจะแสดงผล แต่การเปลี่ยนแปลงจะมีผลแทบจะทันที

บทความนี้มีประโยชน์หรือไม่