अपने मूल में, एक एजेंट केवल एक लूप होता है। मॉडल को एक लक्ष्य मिलता है, अगली कार्रवाई (आमतौर पर एक टूल कॉल) का निर्णय लेता है, परिणाम को देखता है, और लक्ष्य पूरा होने तक या यह निर्णय लेने तक दोहराता रहता है कि वह आगे बढ़ नहीं सकता। इसे कभी-कभी "ReAct" पैटर्न कहा जाता है — सोचो, कार्रवाई करो, देखो। इसके शक्तिशाली होने का कारण यह है कि मॉडल इटेरेशन के बीच स्थिति बरकरार रखता है: यह अपने पहले की कोशिशों, विफलताओं और एकत्रित जानकारी को याद रखता है। लूप को एक हैरेस द्वारा संचालित किया जाता है — एक कोड का टुकड़ा जो मॉडल को संदेश भेजता है, मॉडल द्वारा अनुरोधित टूल कॉल को निष्पादित करता है, और परिणामों को वापस फीड करता है। LangChain, CrewAI और Anthropic के स्वयं के Agent SDK जैसे फ्रेमवर्क इस हैरेस की पेशकश करते हैं, लेकिन आप इसे लगभग पचास लाइनों के कोड में भी बना सकते हैं। मॉडल स्वयं कुछ भी "चलाता" नहीं है; यह केवल संरचित JSON आउटपुट करता है जो कहता है "इस फ़ंक्शन को इन आर्गुमेंट्स के साथ कॉल करो," और आपका कोड बाकी काम करता है।
एक अच्छे एजेंट और एक परेशाजनक एजेंट के बीच व्यावहारिक अंतर यह है कि आप अपने टूल कैसे परिभाषित करते हैं और आप उसे कितनी स्वतंत्रता देते हैं। एक कोडिंग एजेंट जैसे Claude Code या Cursor के एजेंट मोड में फ़ाइल पढ़ने, फ़ाइल लिखने, शेल कमांड चलाने और कोडबेस में खोजने के लिए टूल हो सकते हैं। एक ग्राहक समर्थन एजेंट में ऑर्डर खोजने, रिफंड जारी करने और टिकटों को बढ़ावा देने के लिए टूल हो सकते हैं। मुख्य डिज़ाइन निर्णय ग्रैनुलारिटी है: बहुत कम टूल और एजेंट कुछ उपयोगी नहीं कर सकता है; बहुत अधिक और यह चुनने में भ्रमित हो जाता है। उत्पादन में, अधिकांश टीमें पाती हैं कि 5–15 अच्छी तरह से परिभाषित टूल एक अच्छा बिंदु हैं। प्रत्येक टूल के लिए एक स्पष्ट नाम, एक अच्छा विवरण (यह मॉडल के लिए यह निर्णय लेने के लिए है कि जब इसका उपयोग करें), और एक अच्छी तरह से प्रकारित पैरामीटर स्कीमा की आवश्यकता होती है।
एजेंट के बारे में सबसे बड़ी गलत धारणा यह है कि वे उपयोगी होने के लिए जटिल मल्टी-एजेंट आर्किटेक्चर की आवश्यकता रखते हैं। उद्योग ने "एजेंट स्वार्म" और "क्रू" पैटर्न के एक चरण में गुजरा जहां आपके पास एक प्लानर एजेंट, एक शोधकर्ता एजेंट, एक लेखक एजेंट और एक आलोचक एजेंट होते थे जो एक दूसरे के साथ बातचीत करते थे। व्यवहार में, एक अच्छे टूल के साथ एक छोटे लूप में एक एकल मॉडल इन जटिल सेटअप के बजाय अक्सर बेहतर प्रदर्शन करता है। मल्टी-एजेंट पैटर्न लेटेंसी, लागत और विफलता मोड जोड़ते हैं। वे वास्तव में समानांतर कार्यों के लिए बनते हैं — उदाहरण के लिए, दस रिपो को एक साथ स्कैन करना — लेकिन अधिकांश क्रमबद्ध कार्यों के लिए, एक एजेंट के साथ स्पष्ट निर्देश काम करते हैं। वास्तविक एजेंट उत्पादों को लॉन्च करने वाली कंपनियां (Anthropic, OpenAI, Google) इस सरल आर्किटेक्चर पर एकजुट हो गई हैं।
विश्वसनीयता कठिन भाग है। 90% समय काम करने वाला एक एजेंट अच्छा लग