OpenAI
Denne siden ble maskinoversatt. Se den opprinnelige engelske artikkelen.

Optimalisering av latens med OpenAI API-modeller

Lær om faktorer som påvirker responstider

Oppdatert: 13 days ago

Latensen til en fullføringsforespørsel påvirkes hovedsakelig av to faktorer: modellen og antallet genererte token. Les den oppdaterte dokumentasjonen vår for veiledning om hvordan du kan forbedre latens.

Var denne artikkelen nyttig?