OpenAI
Halaman ini diterjemahkan oleh mesin. Lihat artikel asli dalam bahasa Inggris.

Apa praktik terbaik untuk mengelola batas laju saya di API?

Saya mendapatkan galat batas laju, tetapi saya rasa saya masih di bawah batas laju saya. Apa yang terjadi?

Diperbarui: 9 days ago

Pengantar batas laju

Batas laju adalah pembatasan yang diterapkan API kami pada berapa kali pengguna atau klien dapat mengakses layanan kami dalam periode waktu tertentu.

Batas laju dapat dikuantisasi, artinya batas tersebut diberlakukan dalam periode waktu yang lebih singkat (misalnya 60.000 permintaan/menit dapat diberlakukan sebagai 1.000 permintaan/detik). Mengirim lonjakan singkat permintaan atau konteks (prompt+max_completion_tokens) yang terlalu panjang dapat menyebabkan galat batas laju, meskipun secara teknis Anda berada di bawah batas laju per menit.

Praktik terbaik untuk mencegah galat batas laju

Organisasi default

Jika Anda tergabung dalam beberapa organisasi dengan paket penagihan dan tingkat penggunaan yang berbeda, pastikan organisasi default Anda diatur ke organisasi yang tepat untuk mengontrol organisasi mana yang digunakan secara default saat membuat permintaan dengan kunci API Anda.

Backoff eksponensial

Sertakan logika backoff eksponensial dalam kode Anda. Ini akan menangkap dan mencoba kembali permintaan yang gagal.

Batas token

Kurangi max_completion_tokens agar sesuai dengan ukuran completion Anda. Kebutuhan penggunaan diperkirakan dari nilai ini, sehingga menguranginya akan menurunkan kemungkinan Anda menerima galat batas laju secara tak terduga. Misalnya, jika prompt Anda membuat completion sekitar 400 token, nilai max_tokens sebaiknya sekitar ukuran yang sama.


Optimalkan prompt Anda. Anda dapat melakukannya dengan membuat instruksi lebih singkat, menghapus kata tambahan, dan menghilangkan contoh tambahan. Anda mungkin perlu menyesuaikan prompt dan mengujinya setelah perubahan ini untuk memastikan prompt tersebut tetap bekerja dengan baik. Manfaat tambahan dari prompt yang lebih singkat adalah biaya yang lebih rendah bagi Anda. Jika Anda memerlukan bantuan, beri tahu kami.

Tingkat penggunaan

Jika Anda sudah menerapkan praktik terbaik ini tetapi masih mengalami galat batas laju, Anda dapat meningkatkan batas laju dengan menaikkan tingkat penggunaan Anda. Anda dapat melihat batas laju saat ini, tingkat penggunaan saat ini, dan cara menaikkan tingkat/batas penggunaan Anda di bagian Limits pada pengaturan akun Anda.

Bacaan lebih lanjut

Tinjau dokumentasi lengkap kami tentang tingkat penggunaan dan batas laju di sini.

Apakah artikel ini membantu?