OpenAI
Ova je stranica strojno prevedena. Pogledajte izvorni članak na engleskom jeziku.

Koje su najbolje prakse za upravljanje mojim ograničenjima brzine u API-ju?

Dobivam pogreške ograničenja brzine, ali mislim da sam ispod svojeg ograničenja. Što se događa?

Ažurirano: 6 days ago

Uvod u ograničenja broja zahtjeva

Ograničenja broja zahtjeva su ograničenja koja naš API nameće broju puta koliko korisnik ili klijent može pristupiti našim uslugama u određenom razdoblju.

Ograničenja broja zahtjeva mogu biti kvantizirana, što znači da se provode tijekom kraćih vremenskih razdoblja (npr. 60.000 zahtjeva u minuti može se provoditi kao 1.000 zahtjeva u sekundi). Slanje kratkih nizova zahtjeva ili konteksta (upiti+max_completion_tokens) koji su predugi može dovesti do pogrešaka ograničenja broja zahtjeva, čak i kada ste tehnički ispod ograničenja broja zahtjeva po minuti.

Najbolje prakse za sprječavanje pogrešaka ograničenja broja zahtjeva

Zadana organizacija

Ako pripadate više organizacija s različitim planovima naplate i razinama upotrebe, provjerite je li vaša zadana organizacija postavljena na odgovarajuću organizaciju kako biste kontrolirali koja se organizacija upotrebljava prema zadanim postavkama pri slanju zahtjeva pomoću vaših API ključeva.

Eksponencijalno odgađanje

Uključite logiku eksponencijalnog odgađanja u svoj kod. Time ćete uhvatiti neuspjele zahtjeve i ponovno ih poslati.

Ograničenja tokena

Smanjite max_completion_tokens tako da odgovara veličini vaših dovršetaka. Potrebe za upotrebom procjenjuju se na temelju te vrijednosti, pa će njezino smanjenje smanjiti vjerojatnost da neočekivano dobijete pogrešku ograničenja broja zahtjeva. Na primjer, ako vaš upit stvara dovršetke od oko 400 tokena, vrijednost max_tokens trebala bi biti približno iste veličine.


Optimizirajte svoje upite. To možete učiniti skraćivanjem uputa, uklanjanjem suvišnih riječi i izbacivanjem suvišnih primjera. Možda ćete morati doraditi upit i testirati ga nakon tih promjena kako biste bili sigurni da i dalje dobro funkcionira. Dodatna je prednost kraćeg upita niži trošak za vas. Ako trebate pomoć, javite nam.

Razina upotrebe

Ako ste primijenili ove najbolje prakse, ali se i dalje susrećete s pogreškama ograničenja broja zahtjeva, ograničenja broja zahtjeva možete povećati povećanjem svoje razine upotrebe. Trenutačna ograničenja broja zahtjeva, trenutačnu razinu upotrebe i upute za povećanje razine upotrebe/ograničenja možete vidjeti u odjeljku Ograničenja u postavkama računa.

Dodatna literatura

Pregledajte našu sveobuhvatnu dokumentaciju o razinama upotrebe i ograničenjima broja zahtjeva ovdje.

Je li vam ovaj članak bio koristan?