OpenAI
यह पेज मशीन द्वारा अनुवादित है. मूल अंग्रेज़ी आर्टिकल देखें.

OpenAI API मॉडल्स के साथ लेटेंसी का अनुकूलन

उन कारकों के बारे में जानें जो प्रतिक्रिया समय को प्रभावित करते हैं

अपडेट किया गया: 14 days ago

कम्प्लीशन अनुरोध की लेटेंसी मुख्य रूप से दो कारकों से प्रभावित होती है: मॉडल और उत्पन्न किए गए टोकन की संख्या। लेटेंसी में सुधार के लिए मार्गदर्शन के लिए कृपया हमारा अपडेटेड दस्तावेज़ पढ़ें: guidance on improving latencies.

क्या यह लेख मददगार था?