La latenza di una richiesta di completamento è influenzata principalmente da due fattori: il modello e il numero di token generati. Leggi la nostra documentazione aggiornata per indicazioni su come migliorare le latenze.
Ottimizzare la latenza con i modelli dell’API OpenAI
Scopri i fattori che influenzano i tempi di risposta
Aggiornato: 15 days ago
