कंप्लीशन अनुरोध की लेटेंसी मुख्य रूप से दो कारकों से प्रभावित होती है: मॉडल और जेनरेट किए गए टोकन की संख्या. कृपया लेटेंसी सुधारने के मार्गदर्शन के लिए हमारा अपडेटेड दस्तावेज़ पढ़ें.
OpenAI API मॉडल के साथ लेटेंसी ऑप्टिमाइज़ करना
उन कारकों के बारे में जानें जो प्रतिक्रिया समय को प्रभावित करते हैं
अपडेट किया गया: 9 days ago
