Code With Claude: Managed Agents, rutinas en cron, SWE-bench salta de 62 a 87%, Zubnet AI Noticias

Anthropic corrió Code With Claude esta semana y envió tres cosas que cambian lo que los builders en Claude mantienen ellos mismos. Managed Agents son primitivas nativas para ejecución de código sandboxed, checkpointing, y scoping de credenciales. Proactive Workflows son rutinas Claude Code que se disparan en horarios cron, webhooks de GitHub, o endpoints API — modo Auto con screening de acciones destructivas y detección de prompt injection, más worktrees para manejo de ramas aisladas. La Capability Curve es el framing: SWE-bench Verified pasó de 62% (Sonnet 3.7, hace un año) a 87% (Opus 4.7, ahora). Demos PM por Jess Yan y Lance Martin; Alex Albert presentó la curva. Los docs ya están live en platform.claude.com/docs/en/managed-agents/overview. Una GUI de escritorio rediseñada con split views y comentarios diff inline envió en paralelo, con un crítico Rubber Duck corriendo después de planning, después de implementación, y antes de tests.

Mecánicamente: Managed Agents es la apuesta de Anthropic para poseer la capa agent-infrastructure de la misma manera que poseen la capa modelo. Ejecución sandboxed + checkpointing + scoping de credenciales son exactamente las primitivas que LangGraph, OpenAI Agents SDK, AutoGen, y el ecosistema wrapper venden. Primitivas nativas significan que, para stacks Claude-first, ya no necesitas manejo de estado estilo-LangGraph atornillado encima. Proactive Workflows trae Claude Code al territorio cron/webhook/disparador-API; lo que antes significaba "envolver claude en un script shell y un timer systemd" ahora es una rutina de primera clase con screens de seguridad built-in. El número Capability Curve es el mensaje estratégico: +25 puntos en SWE-bench Verified en doce meses. El framing de Albert — "set expectations" — es Anthropic apostando que el modelo mejora lo suficientemente rápido para que scaffolding agéntico elaborado se vuelva el lugar equivocado para invertir tiempo de ingeniería.

Efecto ecosistema: este es el mismo movimiento que OpenAI hizo con el Agents SDK y la Assistants API — primitivas tiradas arriba en la pila, la superficie del wrapper se encoge. LangChain, LangGraph, CrewAI, AutoGen, y wrappers Claude-first similares pierden terreno proporcionalmente a cuánto estado y plumbing de credenciales poseían antes. La demarcación interesante es en la capa de protocolo: MCP mantiene la dimensión agent-tools abierta y cross-vendor mientras Managed Agents posee la dimensión ejecución. Proactive Workflows + Worktrees + modo Auto + el crítico Rubber Duck significan que Claude Code está ahora posicionado como runtime agent CI/CD de primera clase, no solo un asistente de codificación — el mismo nicho al que apuntan el track background-agent de Cursor y Codex-in-cloud de OpenAI. La orquestación de agentes cross-vendor (rutear entre Claude/Gemini/OpenAI) es todavía un juego del ecosistema wrapper; los stacks Claude single-vendor obtienen el beneficio más directo.

Lunes: si corres Claude Code en setups cron o CI custom, porta a Routines esta semana — menos partes móviles, y heredas el screen destructive-action del modo Auto y la detección de prompt-injection gratis. Si estás construyendo productos de agentes encima de LangGraph o AutoGen con Claude como modelo primario, audita cuánto manejo de estado está ahora duplicado por Managed Agents (exec sandboxed, checkpointing). En el lado de evals: 62→87% en SWE-bench Verified significa que la mayoría de tareas Python real-world genuinamente difíciles están ahora en scope; los patterns de prompt engineered cuando el modelo estaba en 62% probablemente están over-fitted y te ralentizan — re-corre tu propio eval set contra Opus 4.7 con el scaffolding más simple posible y compara contra tus prompts en producción actuales. El framing Capability Curve es la apuesta year-ahead: mantén tu código suficientemente delgado para que el modelo mejorando sea el camino de upgrade.

Code With Claude: Managed Agents, rutinas en cron, SWE-bench salta de 62 a 87%

Más noticias