OpenAI
यह पेज मशीन द्वारा अनुवादित है. मूल अंग्रेज़ी आर्टिकल देखें.

असिस्टेंट्स API (v2) FAQ

अपडेट किया गया: 3 hours ago

11 मार्च, 2025 से, हमने अपने नए Agents प्लेटफ़ॉर्म के building blocks रिलीज़ कर दिए हैं। विवरण के लिए, Responses API के लिए हमारे API docs, Web Search, File Search, और Computer Use सहित Tools, और Agents SDK (जिसमें Tracing शामिल है) देखें। Assistants API beta पर आपके feedback के आधार पर, हमने Responses API में प्रमुख सुधार शामिल किए हैं। जब हम full feature parity हासिल कर लेंगे, तो हम इस साल के बाद में Assistants API के deprecation plan की घोषणा करेंगे, और लक्ष्य sunset date 2026 की पहली छमाही में होगी।

असिस्टेंट्स API क्या है?

Assistants API डेवलपर्स को अपने ऐप्स के भीतर शक्तिशाली AI असिस्टेंट्स आसानी से बनाने में सक्षम बनाती है। यह API बातचीत का इतिहास मैनेज करने की जरूरत खत्म करती है और Code Interpreter तथा File Search जैसे OpenAI-होस्टेड टूल्स तक पहुंच देती है। यह API 3rd party टूल्स के लिए बेहतर फंक्शन कॉलिंग भी सपोर्ट करती है।

क्या मैं अभी भी Assistants API v1 beta इस्तेमाल कर सकता/सकती हूँ?

नहीं। 18 दिसंबर, 2024 से उपयोगकर्ताओं को Assistant API beta के v1 वर्शन की एक्सेस नहीं रही। फिलहाल हम सिर्फ v2 सपोर्ट करते हैं। v1 से v2 में अपनी API कॉल्स कन्वर्ट करने के लिए कृपया यह migration guide देखें

मैं इसे एक्सेस कैसे करूँ?

Assistants API किसी भी व्यक्ति के लिए उपलब्ध है जिसके पास OpenAI API अकाउंट है। आप Assistants Playground के जरिए भी शुरुआत कर सकते हैं।

Assistant क्या होता है?

Assistant एक उद्देश्य-निर्मित AI का प्रतिनिधित्व करता है जो OpenAI के models का उपयोग करता है और फाइलों तक पहुंच सकता है, persistent threads बनाए रख सकता है, और टूल्स कॉल कर सकता है।

Thread क्या होता है?

Thread, assistant और user के बीच एक conversation session होता है। Threads मैसेज हिस्ट्री स्टोर करके और जब बातचीत मॉडल की context length के लिए बहुत लंबी हो जाती है तो उसे truncate करके, एप्लिकेशन डेवलपमेंट को सरल बनाते हैं।

File Search टूल क्या है?

file_search टूल out of the box कई retrieval best practices लागू करता है ताकि आप अपनी फाइलों से सही डेटा निकालकर मॉडल के जवाबों को बेहतर बना सकें। अधिक जानकारी के लिए, कृपया हमारी developer documentation पढ़ें।

डिफ़ॉल्ट रूप से, file_search टूल निम्न सेटिंग्स का उपयोग करता है:

  • Chunk size: 800 tokens

  • Chunk overlap: 400 tokens

  • Embedding model: 256 dimensions पर text-embedding-3-large

  • Context में जोड़े जाने वाले chunks की अधिकतम संख्या: 20

File upload के लिए क्या प्रतिबंध हैं?

File अपलोड करने के लिए प्रतिबंध:

  • प्रति फाइल 512 MB

  • प्रति फाइल 5M tokens

  • प्रति vector store 10k फाइलें

  • प्रति assistant 1 vector store

  • प्रति thread 1 vector store

किसी संगठन में प्रत्येक प्रोजेक्ट के लिए कुल स्टोरेज लिमिट 100 GB है।

File Search टूल की सीमाएँ क्या हैं?

कुछ ज्ञात सीमाएँ हैं जिनके लिए आने वाले महीनों में सपोर्ट जोड़ने पर हम काम कर रहे हैं:

  1. वर्तमान में chunking, embedding, या retrieval settings में बदलाव करने का कोई तरीका नहीं है।

  2. हम documents के भीतर images की parsing सपोर्ट नहीं करते।

  3. हम structured file formats (जैसे .csv या .jsonl फाइलें) पर retrievals सपोर्ट नहीं करते। Supported file types देखें।

Assistants API के लिए rate limits क्या हैं?

Assistants API के rate limits usage tier और model से बंधे नहीं हैं। इसके बजाय, request type के अनुसार डिफ़ॉल्ट लिमिट्स हैं, कुछ अपवादों के साथ:

  • GET: 1000 RPM

  • POST: 300 RPM

    • /v1/threads/<thread_id>/runs पर POST: 200 RPM

    • /v1/threads/runs पर POST: 200 RPM

  • DELETE: 300 requests per minute

API में Code Interpreter की कीमत कैसे तय होती है?

Code Interpreter की कीमत $0.03 / session है। अगर आपका assistant एक ही समय में दो अलग threads में Code Interpreter कॉल करता है, तो इससे दो Code Interpreter sessions (2 * $0.03) बनेंगे। हर session डिफ़ॉल्ट रूप से एक घंटे तक active रहता है, यानी अगर आपका user उसी thread में एक घंटे तक Code Interpreter को निर्देश देता रहता है तो आप यह शुल्क सिर्फ एक बार ही देंगे।

API में File Search की कीमत कैसे तय होती है?

File Search की कीमत प्रति दिन vector store storage के $0.10/GB है (पहला 1 GB स्टोरेज मुफ़्त है)। vector store का आकार इस बात पर आधारित होता है कि आपकी फाइल parse, chunk और embed होने के बाद vector store का resulting size क्या बनता है।

17 अप्रैल, 2024 से पहले बनाए गए किसी भी vector stores 2024 के अंत तक मुफ़्त रहेंगे, उसके बाद वे या तो:

  • वर्तमान दरों पर बिल किए जाएंगे (फिलहाल $0.10/GB/day), यदि 17 अप्रैल, 2024 के बाद बनाए गए किसी Run में उनका कम से कम एक बार उपयोग हुआ हो।

  • डिलीट कर दिए जाएंगे यदि 17 अप्रैल, 2024 और 31 दिसंबर, 2024 के बीच किसी एक भी Run में उनका उपयोग नहीं हुआ — यह इसलिए ताकि आपको उन vector stores के लिए बिल न लगे जिन्हें आपने इस pricing change की घोषणा से पहले बनाया हो, लेकिन कभी इस्तेमाल नहीं किया।

क्या मैं कितने assistants बना सकता/सकती हूँ, इसकी कोई सीमा है?

किसी org द्वारा बनाए जा सकने वाले assistants की कोई सीमा नहीं है।

क्या API पर streaming उपलब्ध है?

हाँ, Assistants API पर streaming उपलब्ध है।

क्या Assistants API में JSON mode उपलब्ध है?

हाँ, Assistants या Run objects पर response_format parameter के जरिए Assistants API में JSON mode उपलब्ध है।

क्या Assistants API 3rd party function calls के लिए requests भी मैनेज करेगी?

नहीं। हालांकि function calling मॉडल को टूल्स चुनने और उनके लिए requests फ़ॉर्मैट करने में सक्षम बनाता है, लेकिन 3rd party टूल्स को calls execute करना OpenAI द्वारा मैनेज नहीं किया जाता।

मैं OpenAI को जो डेटा भेजता/भेजती हूँ, उसे कैसे हैंडल किया जाता है?

हमारे प्लेटफ़ॉर्म के बाकी हिस्सों की तरह, OpenAI API को भेजा गया डेटा और फाइलें हमारे मॉडलों को ट्रेन करने के लिए कभी इस्तेमाल नहीं किए जाते और आप जब चाहें अपना डेटा डिलीट कर सकते हैं। Assistants API पर अपलोड किया गया डेटा अनिश्चितकाल तक स्टोर रहता है, जब तक कि कोई user उसे मैन्युअली डिलीट न कर दे।

क्या Assistants API के जरिए DALL-E उपलब्ध है?

फिलहाल, DALL-E उपलब्ध नहीं है।

क्या Assistants API के लिए कोई UI है?

आप Assistants API के लिए Playground देख सकते हैं। सुनिश्चित करें कि आप बाईं साइडबार में Assistants व्यू में हैं और ऐसा model उपयोग कर रहे हैं जो उन Tools के साथ compatible हो जिन्हें आप toggle on करना चाहते हैं।

Playground Assistants view editing MyQuickstartAssistant with gpt-3.5-turbo and Code interpreter enabled

Assistants API में assistant instructions के लिए character limit क्या है?

assistant द्वारा उपयोग किए जाने वाले system instructions की अधिकतम लंबाई 256,000 characters है।

मुझे “The server had an error while processing your request. Sorry about that! You can retry your request, or contact us through our help center at help.openai.com if the error persists. “ जैसी error मिल रही है। मुझे क्या करना चाहिए?

अगर आपको यह error मिल रही है, तो इसका मतलब हो सकता है कि आपका prompt सही तरीके से सेट अप नहीं है। यदि आप बार-बार request retry करते हैं और वह fail होती रहती है, तो ये कुछ चीज़ें आज़माएँ:

  1. अपने prompt को इस तरह से restructure करें कि किसी भी function-जैसे commands को functions की तरह treat किया जाए

  2. अपने prompt में मौजूद किसी भी commands को tools में एक function के रूप में जोड़ें

मेरा File Search टूल ठीक से काम क्यों नहीं कर रहा?

File Search टूल का उपयोग करते समय, हम max_prompt_tokens को 20,000 से कम न रखने की सलाह देते हैं। लंबी बातचीत या File Search के साथ कई interactions के लिए, इस सीमा को 50,000 तक बढ़ाने पर विचार करें, या आदर्श रूप से, सर्वोच्च गुणवत्ता के परिणाम पाने के लिए max_prompt_tokens limits को पूरी तरह हटा दें। अधिक पढ़ें यहाँ

मैं feedback कैसे दे सकता/सकती हूँ?

हमें Developer Forum पर, help.openai.com के Help Center के जरिए, या Twitter पर @OpenAIDevs पर आपका feedback सुनकर खुशी होगी।

क्या यह लेख मददगार था?