Un científico de datos acaba de demostrar lo que hemos estado esperando: IA que maneja flujos de trabajo completos, no solo fragmentos de código. Usando Codex y Model Context Protocol (MCP), procesó 1.85GB de datos XML de Apple Health—desde la descarga de Google Drive hasta el análisis de BigQuery—en 30 minutos. La IA localizó archivos, referenció código de GitHub de hace seis años, escribió parsers de Python, subió datasets, ejecutó consultas SQL, y generó un reporte estructurado. Lo que habría sido "al menos un día completo" de trabajo manual se convirtió en una conversación guiada con un agente de IA.

Esto importa porque representa el cambio de la IA como asistente de codificación hacia la IA como participante del flujo de trabajo. Mientras que herramientas como Cursor y Claude ayudan a escribir funciones individuales, este enfoque conecta Google Drive, GitHub, BigQuery, y herramientas de análisis a través de MCP—esencialmente creando agentes de IA que entienden toda tu infraestructura de datos. El desarrollador eligió explícitamente Codex sobre su Claude habitual para probar las herramientas, sugiriendo que estos flujos de trabajo se están estandarizando entre proveedores.

No existe otra cobertura aún, lo cual es revelador. La comunidad de ciencia de datos tiende a ser escéptica del hype de IA, pero esto se siente diferente—es un ejemplo funcional con cronogramas específicos, tamaños de archivo, e integraciones de herramientas. El autor admite que este fue un "ejemplo simple" con datos de salud personal, no complejidad a escala empresarial con requisitos de governance, problemas de calidad de datos, o restricciones regulatorias.

Para desarrolladores construyendo flujos de trabajo de IA, esto valida el enfoque MCP para conectar sistemas dispares. La prueba real no es si la IA puede analizar datasets limpios—es si puede manejar la ingeniería de datos desordenada del mundo real que usualmente mata los proyectos personales. Basándose en este ejemplo, nos estamos acercando.