Latența unei cereri de completare este influențată în principal de doi factori: modelul și numărul de tokeni generați. Vă rugăm să citiți documentația noastră actualizată pentru îndrumări privind îmbunătățirea latențelor.
Optimizarea latenței cu modelele API OpenAI
Aflați despre factorii care influențează timpii de răspuns
Actualizat: 18 days ago
