AWS DevOps Agent GA पर पहुँचा, root-cause सटीकता 94%, Google के Auto-Diagnose paper के एक सप्ताह बाद

Amazon ने 17 अप्रैल 2026 को DevOps Agent को general availability पर भेजा, एक autonomous incident investigator का production launch जो दिसंबर 2025 से preview में था। जब एक CloudWatch alarm, PagerDuty alert, Dynatrace problem या ServiceNow ticket trigger होता है, agent मानव prompt के बिना कमान ले लेता है: यह telemetry को correlate करता है, services के पार dependencies को trace करता है, हाल के deployment और code परिवर्तनों को खींचता है, और एक root-cause प्रस्तावित करता है। यह launch Google के Auto-Diagnose preprint के एक सप्ताह बाद उतरता है, जिसने integration-test log triage के लिए Gemini 2.5 Flash का उपयोग किया था, 90.14% root-cause सटीकता के साथ। दो प्रमुख cloud विक्रेता एक ही सप्ताह में LLM-संचालित SRE triage भेजना ही कहानी है, अलग-अलग कोई एक उत्पाद नहीं।

Hood के नीचे यह Amazon Bedrock AgentCore है, जो AWS का agent runtime है, कोई custom model stack नहीं। पहले दिन से integration surface व्यापक है: observability पक्ष पर CloudWatch, Datadog, Dynatrace, New Relic, Splunk और Grafana; code और CI-CD पक्ष पर GitHub, GitLab और Azure DevOps; GA में Azure और on-premises समर्थन जोड़ा गया। Model Context Protocol (MCP) custom skills के लिए extension mechanism है, जो AWS के SRE agent और Anthropic की मूल MCP spec को एक ही standards track पर रखता है। Billing agent runtime के per-second है, AWS Support ग्राहकों को support tier के हिसाब से मासिक DevOps Agent credits मिलते हैं, और launch regions में North Virginia, Ireland, Frankfurt सहित तीन और शामिल हैं।

AWS की preview metrics: MTTR में 75% तक की कमी और 94% root-cause सटीकता। Google के test corpus पर Auto-Diagnose की 90.14% से तुलना करें, और convergence को नज़रअंदाज़ करना मुश्किल है। दो अलग codebases, दो अलग frontier models, दो अलग target workloads (integration tests बनाम production incidents), एक-दूसरे के 4 percentage points के भीतर उतरते हैं। यह आपको बताता है: frontier models, सावधान prompting, structured telemetry, और एक refusal-on-ambiguity नियम अब इस task की छत हैं। किसी भी विक्रेता ने custom model को fine-tune नहीं किया; दोनों ने prompting अनुशासन और कसी हुई integration पर भरोसा किया। डेवलपर्स के लिए मायने रखने वाला अंतर यह है कि AWS का agent cross-vendor डिज़ाइन से है (यह आपके Datadog को पढ़ता है और आपके PagerDuty से बात करता है), जबकि Google का internal-only है और product के रूप में नहीं आता।

यदि आप AWS पर चलते हैं और आपके पास वास्तविक incident volume है, तो playbook रातोंरात बदल जाता है। Integration surface वही tools हैं जिन्हें आप पहले से उपयोग करते हैं, और per-second billing का अर्थ है कि आप वास्तविक agent runtime के लिए भुगतान करते हैं, idle capacity के लिए नहीं। Production में विश्वास करने से पहले दो चीज़ें देखने लायक हैं। पहला, पूर्ण incident cadence पर per-second pricing: प्रति माह कुछ सौ incidents पर 10 मिनट के agent runs, यह एक और log pipeline जोड़ने जैसा नहीं है। दूसरा, refusal व्यवहार। Auto-Diagnose की कठोर anti-hallucination बाधा सटीकता को ऊँचा रखने वाला सबसे महत्वपूर्ण engineering विकल्प था। AWS की GA घोषणा से यह स्पष्ट नहीं है कि Bedrock AgentCore समकक्ष अनुशासन लागू करता है, या यह telemetry पतली होने पर आत्मविश्वास से गलत उत्तर भेजता है। AWS पर नहीं वाले डेवलपर्स के लिए, संकेत यह है कि autonomous incident investigation अब दो live विक्रेताओं और MCP में एक de-facto interoperability standard वाला product श्रेणी है। अपेक्षा करें कि Azure एक तिमाही में समकक्ष कुछ भेजेगा, और बाद में करने के बजाय अभी runbooks को agent-legible formats में फिर से लिखना शुरू करें।

AWS DevOps Agent GA पर पहुँचा, root-cause सटीकता 94%, Google के Auto-Diagnose paper के एक सप्ताह बाद

और समाचार