एजेंट: परिभाषा और अर्थ — AI विकी

एक एआई प्रणाली जो स्वतंत्र रूप से बहु-चरण कार्यों की योजना बना सकती है और निष्पादित कर सकती है, उद्देश्य प्राप्त करने के लिए उपकरणों (वेब खोज, कोड निष्पादन, API कॉल) का उपयोग करके। एक साधारण चैटबॉट के विपरीत जो एक समय में एक प्रश्न का उत्तर देता है, एक एजेंट अब तक सीखे गए कुछ के आधार पर अगला क्या करना चाहिए यह निर्णय करता है।

यह क्यों मायने रखता है

एजेंट्स 'बात करने वाली एआई' और 'काम करने वाली एआई' के बीच का पुल हैं। जब आपकी एआई डॉक्स ब्राउज़ कर सके, कोड लिख सके और इसे टेस्ट कर सके, बिना आपके प्रत्येक चरण में उसका हाथ छोड़े — वह एक एजेंट है।

गहन अध्ययन

अपने मूल में, एक एजेंट केवल एक लूप होता है। मॉडल को एक लक्ष्य मिलता है, अगली कार्रवाई (आमतौर पर एक टूल कॉल) का निर्णय लेता है, परिणाम को देखता है, और लक्ष्य पूरा होने तक या यह निर्णय लेने तक दोहराता रहता है कि वह आगे बढ़ नहीं सकता। इसे कभी-कभी "ReAct" पैटर्न कहा जाता है — सोचो, कार्रवाई करो, देखो। इसके शक्तिशाली होने का कारण यह है कि मॉडल इटेरेशन के बीच स्थिति बरकरार रखता है: यह अपने पहले की कोशिशों, विफलताओं और एकत्रित जानकारी को याद रखता है। लूप को एक हैरेस द्वारा संचालित किया जाता है — एक कोड का टुकड़ा जो मॉडल को संदेश भेजता है, मॉडल द्वारा अनुरोधित टूल कॉल को निष्पादित करता है, और परिणामों को वापस फीड करता है। LangChain, CrewAI और Anthropic के स्वयं के Agent SDK जैसे फ्रेमवर्क इस हैरेस की पेशकश करते हैं, लेकिन आप इसे लगभग पचास लाइनों के कोड में भी बना सकते हैं। मॉडल स्वयं कुछ भी "चलाता" नहीं है; यह केवल संरचित JSON आउटपुट करता है जो कहता है "इस फ़ंक्शन को इन आर्गुमेंट्स के साथ कॉल करो," और आपका कोड बाकी काम करता है।

टूलबॉक्स डिज़ाइन करें

एक अच्छे एजेंट और एक परेशाजनक एजेंट के बीच व्यावहारिक अंतर यह है कि आप अपने टूल कैसे परिभाषित करते हैं और आप उसे कितनी स्वतंत्रता देते हैं। एक कोडिंग एजेंट जैसे Claude Code या Cursor के एजेंट मोड में फ़ाइल पढ़ने, फ़ाइल लिखने, शेल कमांड चलाने और कोडबेस में खोजने के लिए टूल हो सकते हैं। एक ग्राहक समर्थन एजेंट में ऑर्डर खोजने, रिफंड जारी करने और टिकटों को बढ़ावा देने के लिए टूल हो सकते हैं। मुख्य डिज़ाइन निर्णय ग्रैनुलारिटी है: बहुत कम टूल और एजेंट कुछ उपयोगी नहीं कर सकता है; बहुत अधिक और यह चुनने में भ्रमित हो जाता है। उत्पादन में, अधिकांश टीमें पाती हैं कि 5–15 अच्छी तरह से परिभाषित टूल एक अच्छा बिंदु हैं। प्रत्येक टूल के लिए एक स्पष्ट नाम, एक अच्छा विवरण (यह मॉडल के लिए यह निर्णय लेने के लिए है कि जब इसका उपयोग करें), और एक अच्छी तरह से प्रकारित पैरामीटर स्कीमा की आवश्यकता होती है।

एक एजेंट एक स्वार्म से बेहतर होता है

एजेंट के बारे में सबसे बड़ी गलत धारणा यह है कि वे उपयोगी होने के लिए जटिल मल्टी-एजेंट आर्किटेक्चर की आवश्यकता रखते हैं। उद्योग ने "एजेंट स्वार्म" और "क्रू" पैटर्न के एक चरण में गुजरा जहां आपके पास एक प्लानर एजेंट, एक शोधकर्ता एजेंट, एक लेखक एजेंट और एक आलोचक एजेंट होते थे जो एक दूसरे के साथ बातचीत करते थे। व्यवहार में, एक अच्छे टूल के साथ एक छोटे लूप में एक एकल मॉडल इन जटिल सेटअप के बजाय अक्सर बेहतर प्रदर्शन करता है। मल्टी-एजेंट पैटर्न लेटेंसी, लागत और विफलता मोड जोड़ते हैं। वे वास्तव में समानांतर कार्यों के लिए बनते हैं — उदाहरण के लिए, दस रिपो को एक साथ स्कैन करना — लेकिन अधिकांश क्रमबद्ध कार्यों के लिए, एक एजेंट के साथ स्पष्ट निर्देश काम करते हैं। वास्तविक एजेंट उत्पादों को लॉन्च करने वाली कंपनियां (Anthropic, OpenAI, Google) इस सरल आर्किटेक्चर पर एकजुट हो गई हैं।

विश्वसनीयता की समस्या

विश्वसनीयता कठिन भाग है। 90% समय काम करने वाला एक एजेंट अच्छा लग

एजेंट

यह क्यों मायने रखता है

गहन अध्ययन

टूलबॉक्स डिज़ाइन करें

एक एजेंट एक स्वार्म से बेहतर होता है

विश्वसनीयता की समस्या

संबंधित अवधारणाएँ