Το latency ενός αιτήματος completion επηρεάζεται κυρίως από δύο παράγοντες: το μοντέλο και τον αριθμό των token που δημιουργούνται. Διαβάστε την ενημερωμένη τεκμηρίωσή μας για οδηγίες για τη βελτίωση των latencies.
Βελτιστοποίηση του latency με μοντέλα API της OpenAI
Μάθετε για τους παράγοντες που επηρεάζουν τους χρόνους απόκρισης
Τελευταία ενημέρωση: 15 days ago
