Die Latenz einer Completion-Anfrage wird hauptsächlich von zwei Faktoren beeinflusst: dem Modell und der Anzahl der generierten Token. Lies unsere aktualisierte Dokumentation mit Hinweisen zur Verbesserung der Latenzen.
Latenz mit OpenAI-API-Modellen optimieren
Erfahre, welche Faktoren Antwortzeiten beeinflussen
Aktualisiert: 10 days ago
