Latensen til en fullføringsforespørsel påvirkes hovedsakelig av to faktorer: modellen og antallet genererte token. Les den oppdaterte dokumentasjonen vår for veiledning om hvordan du kan forbedre latens.
Optimalisering av latens med OpenAI API-modeller
Lær om faktorer som påvirker responstider
Oppdatert: 13 days ago
