DeepMind ने इस हफ्ते AlphaEvolve पर एक year-one impact report जारी की — मई 2025 में पेश किया गया Gemini-powered coding agent जो स्वायत्त रूप से algorithms discover और optimize करता है। Results असामान्य रूप से concrete हैं: DNA variant detection में 30% error reduction, electricity grid optimization पर 14%→88% feasible solutions, Google के Willow quantum processor पर 10× error reduction, और counterintuitive TPU circuit designs जो silicon में पहुंच गए। जो कोई सोच रहा था कि "AI विज्ञान करता है" marketing था या substance, यह substance वाला पक्ष है।
AlphaEvolve Gemini पर बना एक agentic system है जो iteratively candidate solutions generate, evaluate और refine करके algorithms discover करता है, defined fitness function के विरुद्ध — chain-of-thought reasoning के बजाय LLM proposal/critique में wrapped evolutionary search के करीब। 2025 का original paper mechanism describe करता था; इस हफ्ते की release deployed results report करती है। Specific gains: Spanner write amplification 20% कम, compiler footprint 9% कम, mathematician Terence Tao ने इसके साथ Erdős problems और Ramsey number bounds पर collaborate किया, Traveling Salesman Problem bounds सुधरे। Commercial customers: Klarna ने transformer training speed double की; FM Logistic ने routing optimization के माध्यम से 15,000 km/year बचाए (10.4% efficiency gain); WPP को campaign modeling accuracy में 10% improvement मिला; Schrödinger को ML force field training और inference में 4× speedup मिला। Google Cloud access path है — कोई open-source release नहीं, कोई paper update नहीं, बस पिछले साल publish हुई methodology का deployment-mode coverage update।
Coding agents ज्यादातर developer productivity tools के रूप में positioned हुए हैं — Claude Code, Cursor, GitHub Copilot — human-defined problems की सेवा में code generate करते हुए। AlphaEvolve अलग category में है: human problem define करता है, agent algorithm space में तब तक search करता है जब तक कि वह मौजूदा से बेहतर किसी चीज़ पर converge नहीं हो जाता। इस report में अधिकांश gains उन problems से आते हैं जहाँ पहले से एक known optimal-ish solution था और AlphaEvolve ने बेहतर पाया — TPU circuit designs जो "counterintuitive" हैं और silicon में जा रहे हैं, सबसे मजबूत signal है कि यह सिर्फ known tricks को सिलना नहीं है। Research labs के लिए, implication यह है कि algorithmic improvement clean fitness functions वाले problems पर human researchers का exclusive province नहीं रहेगा। बाकी सब के लिए: 20% कम Spanner storage cost, 10× cleaner quantum operations, और 30% fewer sequencing errors चुपचाप उन चीज़ों में compound होते हैं जो downstream products को बदलते हैं बिना कभी announce हुए।
AlphaEvolve Google Cloud के माध्यम से API-gated है, open-source नहीं। alphaevolve-examples.web.app पर interactive gallery account requirement के बिना concrete cases दिखाती है। अगर आपके पास measurable fitness function के साथ एक hard optimization problem है — kernel-level performance, routing, circuit design, drug screening — यह वो agent shape है जिसे watch करना चाहिए। अगर आप knowledge work कर रहे हैं जहाँ success subjective है, यह आपका tool नहीं है। Track करने वाला बड़ा pattern: AlphaEvolve और OpenAI के recent ML-research-automation claims एक ही direction में point करते हैं (agents algorithmic work कर रहे हैं, सिर्फ plumbing नहीं), और यह संभवतः "मेरे लिए एक Python script लिखो" से परे agent race की अगली frontier है।
