OpenAI
यह पेज मशीन द्वारा अनुवादित है. मूल अंग्रेज़ी आर्टिकल देखें.

OpenAI API मॉडल के साथ लेटेंसी ऑप्टिमाइज़ करना

उन कारकों के बारे में जानें जो प्रतिक्रिया समय को प्रभावित करते हैं

अपडेट किया गया: 9 days ago

कंप्लीशन अनुरोध की लेटेंसी मुख्य रूप से दो कारकों से प्रभावित होती है: मॉडल और जेनरेट किए गए टोकन की संख्या. कृपया लेटेंसी सुधारने के मार्गदर्शन के लिए हमारा अपडेटेड दस्तावेज़ पढ़ें.

क्या यह लेख मददगार था?