T-Head de Alibaba envió Zhenwu M890, un acelerador AI explícitamente enmarcado como construido para cargas de trabajo de agente — contexto largo, coordinación modelo-a-modelo en tiempo real, ejecución de tarea multi-paso con intervención humana limitada. 3x de rendimiento reclamado sobre el predecesor Zhenwu 810E. T-Head reporta 560,000+ unidades Zhenwu enviadas hasta la fecha, 400+ clientes externos en 20 industrias incluyendo automotriz y servicios financieros. Disponible a través de la plataforma Bailian de Alibaba Cloud; entrega a escala de rack en el Panjiu AL128 (128 aceleradores M890 por rack). Hoja de ruta: M890 ahora, V900 Q3 2027 (otro ~3x esperado), J900 Q3 2028. Alibaba simultáneamente lanzó Qwen 3.7-Max — reclamado operar continuamente hasta 35 horas en tareas de agente sin degradación de rendimiento. Nodo de proceso, FLOPs, ancho de banda de memoria, y números de comparación con NVIDIA H100/H200 no divulgados en el anuncio.
El silicio agente-objetivo es ahora una categoría de hardware discreta. NVIDIA envió Vera el 17 de mayo — 88 núcleos Olympus, 1.2 TB/s de ancho de banda de memoria, el mismo encuadre "construido para agentes" — a Anthropic, OpenAI, SpaceXAI, y Oracle. Alibaba envía Zhenwu M890 hoy con la misma tesis. La afirmación técnica compartida: las cargas agentic estresan diferentes partes del silicio que la inferencia densa. Limitadas por ancho de banda de memoria (contexto largo, trazas grandes de tool-call). Comunicación inter-acelerador rápida (coordinación multi-modelo). Rendimiento sostenido durante horas en lugar de segundos (el número de 35 horas de Qwen 3.7-Max). El empaque Panjiu AL128 — 128 aceleradores por rack — es la arquitectura del sistema para esa clase de carga: la coordinación a nivel de rack es la unidad de despliegue, no la inferencia de tarjeta única. Los números concretos de despliegue (560K unidades, 400+ clientes) ponen esto más allá de la etapa piloto. La hoja de ruta larga (V900 2027, J900 2028) es la apuesta a que la demanda continúa.
Lectura del ecosistema. Cada laboratorio frontera importante ahora tiene una historia de hardware para agentes. NVIDIA (Vera) → Anthropic/OpenAI/SpaceXAI/Oracle. Google (TPU más la JV Blackstone, 500 MW para 2027) → acceso multi-nube de terceros. Alibaba (Zhenwu M890 + Bailian + Panjiu AL128) → mercado empresarial chino más la base de clientes de 20 industrias. El mercado de cargas de trabajo de agente es lo suficientemente grande para que las pilas de silicio verticalmente integradas tengan sentido comercial. Para China específicamente, la línea Zhenwu de Alibaba más la pista Huawei Ascend más la capacidad de fabricación de SMIC es la respuesta de silicio doméstico al acuerdo H200 estancado que cubrimos el 19 de mayo — 750K GPUs H200 licenciadas a compradores chinos, cero enviadas, bloqueo del lado de Beijing. Alibaba no necesita NVIDIA si Zhenwu V900 aterriza en Q3 2027 como prometido. Para builders de EE.UU. y EU considerando infraestructura agentic, las pilas de silicio propietario de código cerrado están convergiendo en el patrón Vera/Zhenwu/TPU. Las alternativas de pila abierta (AMD MI400, Intel Gaudi 3, ARM personalizado) están rezagadas en la optimización específica para cargas de agente por ahora.
Lunes: si estás planificando capacidad de infraestructura de agente, la pregunta relevante no es "¿qué FLOPs?" sino "¿cómo se ve el rack y cuánto cuesta correr cargas agentic de 35 horas?" El Panjiu AL128 sugiere la respuesta: la coordinación a nivel de rack de 128 aceleradores es la unidad de despliegue. Para builders con usuarios finales chinos, Alibaba Cloud Bailian más Zhenwu M890 es ahora una opción de producción real, no un piloto. Para builders de EE.UU. y EU, vigila la próxima llamada de resultados de NVIDIA: con el ingreso China del H200 efectivamente a cero y Vera enviando a labs top, la flexibilidad de precios de NVIDIA en Vera vs Zhenwu M890 te dirá si NVIDIA compite en precio de silicio-agente o se diferencia en ecosistema (CUDA, NCCL, integración MCP, referencias de clientes Anthropic/OpenAI). Los próximos 12 meses son cuando "silicio agente-objetivo" deja de ser una afirmación de marketing y comienza a ser una línea de benchmark medible. Vigila una suite MLPerf o equivalente para cargas de agente multi-hora sostenidas — esa es la brecha de eval ahora mismo, y el vendor que gana el benchmark gana el ciclo de procura.
