IBM anunció el 28 de abril la disponibilidad general de Bob, una plataforma de desarrollo de IA orientada a empresas que luchan con deuda técnica, nube híbrida y cumplimiento. Bob cubre todo el SDLC — descubrimiento, planificación, codificación, pruebas, despliegue, operaciones — y usa agentes basados en roles coordinados por workflows gobernados. El lanzamiento llega la misma semana que el anuncio de la facturación por uso de GitHub Copilot, y el encuadre es similar: las herramientas de IA para desarrolladores en la empresa tienen que controlar costo y riesgo, no sólo acelerar la escritura. IBM dice que 80.000 de sus propios empleados ya usan Bob, con una ganancia promedio de productividad del 45% — una cifra para archivar bajo "autoinforme del proveedor" hasta que se verifique de forma independiente.
Por debajo, Bob es una plataforma de ruteo de modelos. Mezcla LLM de frontera (sin especificar cuáles), modelos open source, los SLM Granite de IBM y modelos fine-tuned para tareas específicas, eligiendo por tarea según precisión, latencia y costo. La parte agentic es coordinación multi-agente a través de pipelines de pruebas, documentación y CI/CD, con human-in-the-loop en las fronteras. La capacidad más diferenciada — y la que la mayoría de las otras herramientas de IA para desarrolladores se saltan en silencio — es la modernización de mainframes. IBM cita a APIS IT, un operador informático gubernamental croata, migrando servicios .NET y sistemas legacy JCL/PL/I, con documentación de arquitectura entregada 10× más rápido y "100% de precisión en sistemas legacy JCL/PL/I." Esa segunda afirmación es del tipo que sólo significa algo cuando ves el corpus de prueba; sola, es marketing.
IBM ya ha estado aquí antes. Watson AIOps, Watson Code Assistant for Z, el Watson Discovery original — IBM ha lanzado herramientas de IA para desarrolladores en empresa varias veces, y el rastro de resultados de clientes ha sido mixto. Bob es interesante porque la arquitectura es genuinamente moderna — multi-agente más ruteo de modelos entre SLM y LLM de frontera, no sólo un modelo grande detrás de un wrapper — y porque el soporte de mainframes es un foso real. Cursor, Claude Code y Copilot no llegan con experticia en PL/I. Pero los modos de falla que IBM advierte son reales: alucinación en entornos legacy sin documentar, silos de RAG, modelos que sugieren código sintácticamente correcto pero funcionalmente inútil. Si Bob realmente resuelve esto o sólo lo tapa con orquestación multi-agente es la pregunta abierta, y los materiales de lanzamiento de IBM no la responden.
Para los builders que no hacen SDLC empresarial, Bob es principalmente una señal de mercado: IBM piensa que la próxima ronda de competencia en herramientas de IA para desarrolladores en empresa se va a jugar en gobernanza, ruteo de modelos y integración con sistemas legacy, no en velocidad de chat. Para los builders dentro de empresas con deuda en mainframe, ésta es una de las pocas opciones que apunta explícitamente a tu problema; la jugada inteligente es pilotearlo en un módulo legacy contenido y medir la tasa real de alucinación contra tu propio código, en vez de creer el titular del 100%. La prueba de 30 días es la palanca para eso. Y para todos los que miran el sector: presten atención al patrón de ruteo de modelos de IBM — mezclar SLM Granite chicos para tareas voluminosas baratas con LLM de frontera para tareas duras es la arquitectura que toda empresa preocupada por costos va a querer replicar, con o sin IBM.
