Microsoft Fara1.5: agentes browser 4B/9B/27B, 27B 72% Mind2Web vs Operator 58%

El laboratorio AI Frontiers de Microsoft Research lanzó Fara1.5: una familia de agentes browser computer-use en tamaños 4B, 9B, y 27B parámetros, construida sobre checkpoints base Qwen3.5. Los modelos leen capturas de pantalla y emiten acciones de mouse/teclado a través de un bucle observe-think-act — cada paso toma el historial de conversación previo más las tres capturas más recientes, produce pensamientos y una sola acción. El espacio de acción incluye entradas estándar más operaciones web-específicas (búsquedas) y meta-acciones para gestión de contexto y clarificación del usuario. Online-Mind2Web (300 tareas, 136 sitios): Fara1.5-27B al 72%, Fara1.5-9B al 63.4%. Conjunto de comparación: OpenAI Operator 58.3%, Gemini 2.5 Computer Use 57.3%, Yutori Navigator n1 64.7%. WebVoyager: 27B 88.6%, 9B 86.6%, 4B 80.8%. Entrenamiento: ~2 millones de muestras supervisadas — 60% trayectorias web, 12.8% entornos sintéticos, 12.5% llenado de formularios/interacciones, 8.8% grounding, 4.9% VQA, más datos de seguridad. Pausas de seguridad en info personal faltante, descripciones de tarea ambiguas, acciones irreversibles sin aprobación. Disponibilidad open-source, pesos, licencia, y detalles de despliegue HuggingFace/Azure no especificados todavía en el anuncio.

Dos cosas a notar. Microsoft Research construyendo sobre Qwen3.5 base — eso es Microsoft usando fundamentos open-weight chinos para construir un producto agéntico occidental. El mismo patrón cross-vendor de inicialización de pesos que cubrimos la semana pasada con Nemotron-Labs-Diffusion de NVIDIA construido sobre Ministral3. Microsoft tiene su propia familia Phi pero eligió Qwen3.5 como punto de partida para el agente browser. La comparación OpenAI Operator es el movimiento estratégico. Microsoft es el mayor inversor y socio de OpenAI, sin embargo Microsoft Research está enviando un agente browser grado-investigación que supera a Operator por 13.7 puntos en Online-Mind2Web. Microsoft está cubriendo su dependencia de OpenAI construyendo in-house en Microsoft Research. Tres tamaños (4B/9B/27B) significa flexibilidad de despliegue: tareas edge a 4B local, tareas grado-servidor a 27B en datacenter. El espacio de meta-acción que soporta gestión de contexto y clarificación del usuario — pausa por info personal, pausa por tareas ambiguas, pausa antes de lo irreversible — es el diferenciador que hace los agentes browser desplegables. Agentes que no preguntan antes de acciones destructivas son agentes que no puedes poner en producción.

Contexto del ecosistema. El espacio de agentes browser calentándose más allá de los incumbentes API-cerrada. OpenAI Operator (cerrado, clase-GPT). Google Gemini 2.5 Computer Use (cerrado, basado-Gemini). Anthropic Computer Use (cerrado, basado-Claude). Ahora Microsoft Fara1.5 (basado-Qwen3.5, tres tamaños, disponibilidad TBD). Los números de benchmark dicen que la familia grado-investigación de Microsoft ya supera la frontera API-cerrada en Online-Mind2Web. Si Microsoft libera pesos Fara1.5 públicamente, la categoría agente browser pesos-abiertos obtiene una entrada clase-frontera real de la noche a la mañana. Si lo mantienen cerrado y enrutan a través de integración Azure/Bing/Edge, se convierte en la defensa de Microsoft contra OpenAI capturando la capa de agente. De cualquier manera, la presión de benchmark ahora está en Operator y Gemini Computer Use para enviar la siguiente iteración con números comparables. Para builders enviando productos browser-automation hoy: el modelo 4B al 80.8% WebVoyager es el tamaño interesante — lo suficientemente accesible para despliegue local, lo suficientemente capaz para manejar la mayoría de tareas browser.

Lunes: si envías productos browser-automation o computer-use (reemplazos RPA, web scraping, pruebas QA, automatización de flujo de trabajo de soporte al cliente), evalúa Fara1.5 tan pronto como aterrice la disponibilidad. Pruebas específicas en tu distribución de tareas: (1) flujos de inicio de sesión con MFA, (2) llenado de formularios con lógica condicional, (3) navegación multi-página preservando estado, (4) recuperación de errores desde estados de página inesperados. La variante 4B es el tamaño para comenzar — si el 80.8% WebVoyager se traduce en 70-80% en tus tareas, tienes un agente desplegable sin inferencia de datacenter. Para competidores código-cerrado (Operator, Gemini Computer Use, Anthropic Computer Use): la posición competitiva de precios acaba de obtener presión real. Operator a $200/mes por usuario versus desplegar-tu-propio Fara1.5-4B localmente es una curva de costo fundamentalmente diferente si Microsoft libera pesos. Vigila HuggingFace y el blog de Microsoft Research durante las próximas 48 horas para el anuncio de pesos y licencia. La brecha de benchmark (72% vs 58%) es real, y la consecuencia competitiva downstream depende de si Microsoft envía pesos o mantiene Fara1.5 como capacidad Azure-interna.

Microsoft Fara1.5: agentes browser 4B/9B/27B, 27B 72% Mind2Web vs Operator 58%

Más noticias