Questa pagina è stata tradotta automaticamente. Visualizza l'articolo originale in inglese.

Ottimizzare la latenza con i modelli dell’API OpenAI

Scopri i fattori che influenzano i tempi di risposta

Aggiornato: 8 days ago

La latenza di una richiesta di completamento è influenzata principalmente da due fattori: il modello e il numero di token generati. Leggi la nostra documentazione aggiornata per indicazioni su come migliorare le latenze.

Ottimizzare la latenza con i modelli dell’API OpenAI

Questo articolo è stato utile?