ReAct एजेंट असंभव टूल कॉल पर 90% रीट्राई बर्बाद कर रहे हैं

ReAct-स्टाइल एजेंटों के एक व्यवस्थित विश्लेषण से पता चलता है कि वे अपने रीट्राई बजट का 90.8% ऐसी त्रुटियों पर खर्च कर रहे हैं जो कभी सफल नहीं हो सकतीं — विशेष रूप से, हैलूसिनेटेड टूल कॉल जो मौजूद नहीं हैं। अध्ययन ने 200 कार्यों को ट्रैक किया और पाया कि मूल कारण मॉडल सटीकता नहीं बल्कि एक मौलिक आर्किटेक्चरल दोष है: भाषा मॉडलों को `TOOLS.get(tool_name)` जैसे साधारण डिक्शनरी लुकअप के माध्यम से रनटाइम पर टूल नाम चुनने देना। जब मॉडल गैर-मौजूद टूल नामों का हैलूसिनेशन करते हैं, तो सिस्टम पुनर्प्राप्ति योग्य त्रुटियों के बजाय गारंटीड विफलताओं पर कीमती रीट्राई प्रयास बर्बाद करते हैं।

यह प्रोडक्शन AI सिस्टम को परेशान करने वाली एक गहरी इन्फ्रास्ट्रक्चर समस्या को उजागर करता है। जैसे-जैसे एजेंट अधिक जटिल होते जाते हैं — टूल उपयोग, मेमोरी पुनर्प्राप्ति और बाहरी एकीकरण के लिए कई घटकों को चेन करते हुए — विश्वसनीयता इस तरह से संयुक्त होती है जिसे अधिकांश टीमें माप नहीं रही हैं। उद्योग विश्लेषण दिखाता है कि अत्यधिक विश्वसनीय घटक (प्रत्येक 99%) भी जब एक साथ चेन किए जाते हैं तो सिस्टम प्रदर्शन तेजी से गिरता है, केवल 10 घटकों के साथ 90% विश्वसनीयता तक गिर जाता है। अधिकांश मॉनिटरिंग डैशबोर्ड स्वीकार्य सफलता दर और लेटेंसी दिखाते हैं जबकि नीचे हो रहे दक्षता नरसंहार को पूरी तरह से मिस करते हैं।

प्रस्तावित सुधार संरचनात्मक हैं, प्रॉम्प्ट-आधारित नहीं: रीट्राई करने से पहले त्रुटियों को वर्गीकृत करें, प्रति-टूल सर्किट ब्रेकर लागू करें, और टूल रूटिंग को मॉडल आउटपुट के बजाय नियतात्मक कोड में ले जाएं। यह दृष्टिकोण बर्बाद रीट्राई को पूरी तरह से समाप्त करता है और निष्पादन विचलन को 3x कम करता है। व्यापक सबक ReAct एजेंटों से परे फैला हुआ है — जैसे-जैसे उद्योग तेजी से परिष्कृत एजेंट स्टैक बनाता है, सैद्धांतिक मॉडल क्षमताओं और प्रोडक्शन सिस्टम विश्वसनीयता के बीच का अंतर बिना मौलिक बदलावों के केवल बढ़ेगा।

ReAct एजेंट असंभव टूल कॉल पर 90% रीट्राई बर्बाद कर रहे हैं

और समाचार