DeepMind publicó esta semana un informe de impacto del año 1 sobre AlphaEvolve, el agente de código impulsado por Gemini introducido en mayo 2025 para descubrir y optimizar algoritmos de forma autónoma. Los resultados son inusualmente concretos: 30% de reducción de error en detección de variantes ADN, 14%→88% de soluciones factibles en optimización de redes eléctricas, error cuántico dividido por 10 en el procesador Willow de Google, y diseños de circuitos TPU contraintuitivos que terminaron en silicio. Para quien se preguntara si "la IA hace ciencia" era marketing o sustancia, este es el lado sustancia.
AlphaEvolve es un sistema agentico construido sobre Gemini que descubre algoritmos generando, evaluando y refinando iterativamente soluciones candidatas contra una función de fitness definida — más cercano en forma a una búsqueda evolutiva envuelta en propuesta/crítica LLM que a razonamiento chain-of-thought. El paper original de 2025 describía el mecanismo; el lanzamiento de esta semana reporta los resultados desplegados. Ganancias específicas: amplificación de escritura Spanner bajó 20%, huella del compilador bajó 9%, el matemático Terence Tao colaboró con él en problemas de Erdős y cotas de números de Ramsey, cotas del problema del viajante mejoradas. Clientes comerciales: Klarna duplicó la velocidad de entrenamiento transformer; FM Logistic ahorró 15.000 km/año vía optimización de rutas (ganancia de eficiencia 10,4%); WPP obtuvo 10% más precisión en modelado de campañas; Schrödinger obtuvo aceleración 4× en entrenamiento e inferencia de campo de fuerzas ML. Google Cloud es el camino de acceso — sin lanzamiento open-source, sin actualización de paper, solo una actualización modo-despliegue de la metodología publicada el año pasado.
Los agentes de código se han posicionado mayormente como herramientas de productividad de desarrolladores — Claude Code, Cursor, GitHub Copilot — generando código al servicio de problemas definidos humanamente. AlphaEvolve está en una categoría diferente: el humano define el problema, el agente busca en el espacio de algoritmos hasta converger en algo mejor de lo que existía. La mayoría de las ganancias en este informe vienen de problemas donde ya había una solución óptima-ish conocida y AlphaEvolve encontró una mejor — los diseños de circuitos TPU "contraintuitivos" que llegan al silicio son la señal más fuerte de que esto no es solo coser trucos conocidos. Para los laboratorios de investigación, la implicación es que la mejora algorítmica puede no permanecer la provincia exclusiva de los investigadores humanos en problemas con funciones de fitness limpias. Para todos los demás: 20% menos coste de almacenamiento Spanner, 10× operaciones cuánticas más limpias, y 30% menos errores de secuenciación se componen silenciosamente en cosas que cambian productos aguas abajo sin ser nunca anunciadas.
AlphaEvolve está accesible vía API a través de Google Cloud, no open-source. La galería interactiva en alphaevolve-examples.web.app muestra casos concretos sin requisito de cuenta. Si tienes un problema de optimización difícil con una función de fitness medible — rendimiento a nivel kernel, rutas, diseño de circuitos, cribado de fármacos — esta es la forma de agente a observar. Si haces trabajo de conocimiento donde el éxito es subjetivo, esta no es tu herramienta. El patrón más grande a seguir: AlphaEvolve y las afirmaciones recientes de OpenAI sobre automatización de investigación ML apuntan en la misma dirección (agentes haciendo trabajo algorítmico, no solo plomería), y esa es probablemente la próxima frontera de la carrera de agentes más allá de "escríbeme un script Python".
