Uber está expandiendo su alianza con AWS para ejecutar más infraestructura de ride-sharing en los chips Trainium personalizados de Amazon, marcando otra victoria para la estrategia de Amazon de competir con Nvidia a través de silicio IA construido a propósito. El contrato expandido mueve cargas de trabajo adicionales de Uber desde Oracle y Google Cloud hacia el hardware personalizado de AWS, aunque no se revelaron las cargas de trabajo específicas ni los términos financieros.
Esto importa porque es una validación de que la apuesta multimillonaria de Amazon en chips personalizados realmente está funcionando en producción. Mientras todos se obsesionan con el monopolio GPU de Nvidia, Amazon ha estado construyendo silenciosamente una alternativa con Trainium para entrenamiento e Inferentia para inferencia. El compromiso expandido de Uber sugiere que estos chips pueden manejar cargas de trabajo ML del mundo real a escala—no solo demos de marketing de AWS. También es un golpe estratégico a Oracle y Google, que han estado tratando de recuperar cargas de trabajo empresariales con sus propias jugadas de infraestructura IA.
El movimiento encaja con el patrón más amplio de Uber de consolidar en menos proveedores cloud mientras demanda mejores económicas para cargas de trabajo IA. Uber procesa cantidades masivas de datos en tiempo real para precios, ruteo y matching—exactamente el tipo de cargas de trabajo pesadas en inferencia donde el silicio personalizado puede entregar ventajas de costo sobre GPUs de propósito general. Lo que no está claro es si Uber está usando Trainium para entrenar nuevos modelos o solo ejecutar inferencia en los existentes.
Para desarrolladores, esto señala que los chips personalizados de Amazon están listos para producción en cargas de trabajo ML demandantes. Si estás construyendo en AWS y lidiando con altos costos de inferencia, las instancias Trainium e Inferentia podrían valer la pena probar. Pero la historia real es consolidación de infraestructura—apostar por el stack IA completo de un proveedor cloud en lugar de mezclar y combinar entre vendors.
