ระดับการรองรับการใช้งานบน API Platform ช่วยให้คุณซื้อโทเค็นอินพุตและเอาต์พุตของ API จำนวนหนึ่งต่อนาที (เรียกว่า “หน่วยโทเค็น”) ล่วงหน้า เพื่อเข้าถึงสแนปช็อตโมเดลเฉพาะหนึ่งรายการ หน่วยโทเค็นแต่ละหน่วยต้องซื้อขั้นต่ำ 30 วัน
เมื่อคุณลงนามในแบบฟอร์มคำสั่งซื้อแล้ว คุณสามารถเพิ่มและลบหน่วยโทเค็นผ่าน บัญชี API Platform ของคุณได้ โปรดทราบว่าเฉพาะเจ้าขององค์กรและผู้ใช้ที่ได้รับอนุญาตเท่านั้นที่ดูการตั้งค่าระดับการรองรับการใช้งานและซื้อหน่วยโทเค็นอินพุตและเอาต์พุตได้
ดูข้อมูลเพิ่มเติมเกี่ยวกับราคาของระดับการรองรับการใช้งาน
ฉันจะเข้าถึงการตั้งค่าระดับการรองรับการใช้งานได้อย่างไร
เจ้าขององค์กรใน API Platform สามารถเข้าถึงการตั้งค่าระดับการรองรับการใช้งานของตนได้โดยเลือกไอคอนรูปเฟืองการตั้งค่าที่มุมขวาบนของหน้า แล้วเลือกระดับการรองรับการใช้งานใต้ส่วน “องค์กร” ในเมนูทางซ้ายของหน้าจอ
หน้าการตั้งค่าระดับการรองรับการใช้งานช่วยให้คุณเพิ่มความจุ ดูการใช้โทเค็นอินพุต วางแผนความจุ ดูโทเค็นที่จัดสรรไว้ และตรวจสอบผู้ซื้อที่ได้รับอนุญาตของคุณ
ฉันจะซื้อความจุเพิ่มเติมได้อย่างไร
คุณสามารถซื้อความจุได้โดยเลือกปุ่ม Add capacity ที่มุมขวาบนของหน้า ระดับการรองรับการใช้งาน ของคุณ โปรดดูหน้าหลักของระดับการรองรับการใช้งานของเรา เพื่อดูรายละเอียดล่าสุดเกี่ยวกับปริมาณ TPM ที่ได้รับต่อหน่วยโทเค็นอินพุตและเอาต์พุต
หลังจากเลือกประเภทโทเค็นที่จะซื้อแล้ว คุณสามารถป้อนจำนวนโดยตรงหรือเลื่อนแถบเลื่อนเพื่อเลือกจำนวนโทเค็นที่ต้องการซื้อ แถบเลื่อนช่วยให้คุณดูการเปลี่ยนแปลง TPM ในส่วน Summary ได้ง่ายขณะปรับจำนวนโทเค็น เราจะให้คำแนะนำเกี่ยวกับจำนวนหน่วยที่ควรซื้อเพื่อรองรับปริมาณการใช้งานของคุณในช่วง 30 วันที่ผ่านมา
เมื่อเลือกเสร็จแล้ว ให้เลือก Checkout เพื่อยืนยันการซื้อในหน้าต่างโมดัลถัดไป
โปรดทราบว่าราคาที่แสดงในสรุปของเราเป็นอัตรามาตรฐาน และไม่รวมส่วนลดใดๆ ที่เจรจาไว้ในแบบฟอร์มคำสั่งซื้อขององค์กรคุณ ส่วนลดที่เกี่ยวข้องจะถูกนำไปใช้และแสดงในใบแจ้งหนี้ที่ออกให้องค์กรของคุณ หน่วยใดๆ ที่ซื้อจะใช้งานได้จนถึงช่วงเริ่มต้นของรอบใบแจ้งหนี้ถัดไป และจะต่ออายุเป็นรายวันหลังจากนั้น
ฉันจะเปิดใช้งานการเรียก API ให้ใช้โทเค็นของระดับการรองรับการใช้งานได้อย่างไร
คุณต้องเปิดสวิตช์ Scale Tier Enabled ใน Project Settings
หากคุณใช้ Completions API โปรดดูเอกสารของเราที่อธิบายคีย์ service_tier เพิ่มเติม เพื่อพิจารณาว่าคุณควรตั้งค่าด้วยตนเองหรือใช้พฤติกรรมเริ่มต้น
การเรียก Responses API จะใช้ service_tier=auto เป็นค่าเริ่มต้น หากโปรเจ็กต์เปิดใช้ระดับการรองรับการใช้งาน คำขอที่ไม่ได้ระบุ service_tier (หรือใช้ auto) จะใช้ระดับการรองรับการใช้งานเป็นค่าเริ่มต้นเมื่อมีโควตาระดับการรองรับการใช้งานพร้อมใช้งาน คำขอที่มี service_tier=default จะใช้การประมวลผลแบบใช้ร่วมกัน/PAYG
ฉันจะดูประวัติการซื้อและโทเค็นที่หมดอายุได้อย่างไร
คุณสามารถดูประวัติการซื้อระดับการรองรับการใช้งานได้ในหน้า ระดับการรองรับการใช้งาน ของคุณ โดยเลือกโมเดลใต้ Provisioned tokens
เมื่อเลือกโมเดลแล้ว คุณจะสามารถดูโทเค็นที่หมดอายุและธุรกรรมก่อนหน้าได้ที่ด้านล่างของหน้า
ฉันจะแก้ไขความจุโทเค็นได้อย่างไร
คุณสามารถแก้ไขความจุโทเค็นของโมเดลได้โดยเลือกโมเดลใต้ Provisioned tokens ในหน้า ระดับการรองรับการใช้งาน ของคุณ เมื่อเลือกโมเดลแล้ว ให้ค้นหาการซื้อของคุณใต้หัวข้อ Active แล้วเลือก Cancel ข้างการซื้อนั้นเพื่อแก้ไข
ในหน้าต่างโมดัล คุณสามารถป้อนจำนวนหน่วยที่จะยกเลิกได้โดยตรง หรือใช้แถบเลื่อนเพื่อจำลอง TPM ระหว่างเลือก
ฉันจะดู RPM/TPM และการใช้งานระดับการรองรับการใช้งานของฉันได้อย่างไร
คุณสามารถดูสรุปการใช้งาน API สำหรับองค์กรของคุณได้ในหน้า ระดับการรองรับการใช้งาน ของคุณ วันที่และเวลาทั้งหมดอิงตาม UTC และข้อมูลอาจล่าช้าได้สูงสุด 5 นาที
คุณสามารถตรวจสอบการใช้งานได้ในแดชบอร์ดการใช้งานตามกิจกรรม โดยเลือกโมเดลระดับการรองรับการใช้งานของคุณในเมนูดรอปดาวน์โมเดล คุณสามารถดูข้อมูลนี้ในกรอบเวลา 30 วัน, 1 วัน และ 15 นาที ข้อมูลการใช้งานของคุณจะแสดงแบบซ้อนกัน เพื่อเปรียบเทียบปริมาณการใช้งานของโมเดลที่ครอบคลุมโดยระดับการรองรับการใช้งานกับปริมาณการใช้งานที่ครอบคลุมโดยแผนบัญชีของคุณ
โปรดทราบว่าเฉพาะเจ้าขององค์กรเท่านั้นที่ดูแดชบอร์ดการใช้งานได้
เมื่อใดการเปลี่ยนแปลงความจุโทเค็นของฉันจึงจะแสดงในแดชบอร์ดการใช้งาน
การเปลี่ยนแปลงที่คุณทำอาจใช้เวลาสูงสุด 24 ชั่วโมงจึงจะแสดงผล แต่การเปลี่ยนแปลงจะมีผลแทบจะทันที
