Latenci požadavku na dokončení nejvíce ovlivňují dva faktory: model a počet vygenerovaných tokenů. Přečtěte si naši aktualizovanou dokumentaci, kde najdete pokyny ke zlepšení latence.
Optimalizace latence s modely OpenAI API
Zjistěte, které faktory ovlivňují dobu odezvy
Aktualizováno: 14 days ago
