OpenAI
หน้านี้แปลด้วยระบบอัตโนมัติ ดูต้นฉบับภาษาอังกฤษ.

แนวทางปฏิบัติที่ดีที่สุดในการจัดการขีดจำกัดอัตราใน API คืออะไร?

ฉันได้รับข้อผิดพลาดขีดจำกัดอัตรา แต่คิดว่ายังใช้งานไม่ถึงขีดจำกัด เกิดอะไรขึ้น?

อัปเดตล่าสุด: 5 days ago

ข้อมูลเบื้องต้นเกี่ยวกับลิมิตการใช้งาน

ลิมิตการใช้งานคือข้อจำกัดที่ API ของเรากำหนดต่อจำนวนครั้งที่ผู้ใช้หรือไคลเอนต์สามารถเข้าถึงบริการของเราได้ภายในช่วงเวลาที่ระบุ

ลิมิตการใช้งานอาจถูกแบ่งเป็นหน่วยย่อยได้ หมายความว่าจะบังคับใช้ในช่วงเวลาที่สั้นลง (เช่น 60,000 คำขอ/นาที อาจถูกบังคับใช้เป็น 1,000 คำขอ/วินาที) การส่งคำขอแบบเป็นชุดสั้นๆ หรือบริบท (คำสั่ง+max_completion_tokens) ที่ยาวเกินไป อาจทำให้เกิดข้อผิดพลาดเกี่ยวกับลิมิตการใช้งานได้ แม้ในทางเทคนิคแล้วคุณจะยังต่ำกว่าลิมิตการใช้งานต่อนาทีก็ตาม

แนวทางปฏิบัติที่ดีที่สุดในการป้องกันข้อผิดพลาดเกี่ยวกับลิมิตการใช้งาน

องค์กรเริ่มต้น

หากคุณอยู่ในหลายองค์กรที่มีแผนการเรียกเก็บเงินและระดับการใช้งานต่างกัน โปรดตรวจสอบว่าองค์กรเริ่มต้นของคุณถูกตั้งเป็นองค์กรที่เหมาะสม เพื่อควบคุมว่าจะใช้องค์กรใดเป็นค่าเริ่มต้นเมื่อส่งคำขอด้วยคีย์ API ของคุณ

Exponential backoff

ใส่ตรรกะexponential backoffในโค้ดของคุณ วิธีนี้จะตรวจจับและลองส่งคำขอที่ล้มเหลวอีกครั้ง

ขีดจำกัด Token

ลดค่า max_completion_tokens ให้ตรงกับขนาดของ completions ของคุณ ระบบจะประเมินความต้องการใช้งานจากค่านี้ ดังนั้นการลดค่านี้จะลดโอกาสที่คุณจะได้รับข้อผิดพลาดเกี่ยวกับลิมิตการใช้งานโดยไม่คาดคิด ตัวอย่างเช่น หากคำสั่งของคุณสร้าง completions ประมาณ 400 Token ค่า max_tokens ก็ควรมีขนาดใกล้เคียงกัน


ปรับคำสั่งของคุณให้เหมาะสม คุณทำได้โดยทำให้คำแนะนำของคุณสั้นลง ลบคำที่ไม่จำเป็น และตัดตัวอย่างส่วนเกินออก คุณอาจต้องปรับคำสั่งและทดสอบหลังจากเปลี่ยนแปลงแล้ว เพื่อให้แน่ใจว่ายังคงทำงานได้ดี ประโยชน์เพิ่มเติมของคำสั่งที่สั้นลงคือค่าใช้จ่ายของคุณจะลดลง หากต้องการความช่วยเหลือ โปรดแจ้งให้เราทราบ

ระดับการใช้งาน

หากคุณนำแนวทางปฏิบัติที่ดีที่สุดเหล่านี้ไปใช้แล้ว แต่ยังพบข้อผิดพลาดเกี่ยวกับลิมิตการใช้งาน คุณสามารถเพิ่มลิมิตการใช้งานได้โดยเพิ่มระดับการใช้งานของคุณ คุณสามารถดูทั้งลิมิตการใช้งานปัจจุบัน ระดับการใช้งานปัจจุบัน และวิธีเพิ่มระดับ/ลิมิตการใช้งานได้ในส่วน Limitsของการตั้งค่าบัญชี

อ่านเพิ่มเติม

ดูเอกสารฉบับสมบูรณ์ของเราเกี่ยวกับระดับการใช้งานและลิมิตการใช้งานได้ที่นี่

บทความนี้มีประโยชน์หรือไม่