कम्प्लीशन अनुरोध की लेटेंसी मुख्य रूप से दो कारकों से प्रभावित होती है: मॉडल और उत्पन्न किए गए टोकन की संख्या। लेटेंसी में सुधार के लिए मार्गदर्शन के लिए कृपया हमारा अपडेटेड दस्तावेज़ पढ़ें: guidance on improving latencies.
OpenAI API मॉडल्स के साथ लेटेंसी का अनुकूलन
उन कारकों के बारे में जानें जो प्रतिक्रिया समय को प्रभावित करते हैं
अपडेट किया गया: 14 days ago
