La startup de San Francisco SPAN anunció esta semana un pitch de cómputo IA distribuido: instalar nodos GPU XFRA — 16 NVIDIA RTX Pro 6000 Blackwell Server Edition más 4 AMD EPYC CPUs más 3 TB de memoria por nodo, enfriados por líquido, bajo ruido — junto a casas recién construidas, pagar las facturas de electricidad e internet de los propietarios más una tarifa fija de $150 (o posiblemente nada), y escalar a 80.000 nodos para 2027 para más de un gigavatio de cómputo distribuido. Un piloto de 100 casas se lanza este año. El VP Chris Lander le dijo a Ars: "Los data centers son ruidosos, feos, y a menudo elevan las facturas de electricidad locales. [Esto] es silencioso, discreto, y hace la energía más asequible para el anfitrión y la comunidad." SPAN afirma 5× más barato que construir un data center equivalente de 100MW, según su entrevista en CNBC.
Las especificidades de ingeniería importan porque deciden si la economía unitaria funciona. Cada nodo XFRA consume hasta 80 amperios, lo que cabe en el estándar de servicio residencial de 200 amperios que la mayoría de casas de EE.UU. construidas en los últimos 30 años tienen (Lander dice que "80 amperios disponibles en todo momento" es típico). Una batería de 16 kWh, un panel inteligente SPAN, y el software PowerUp gestionan la carga en cada casa. En picos residenciales raros, el sistema usa primero la batería de la casa; en casos extremos, recorta "cargas flexibles no críticas" como la carga de VE, con prioridades configurables por el propietario. La red mueve la carga a otros nodos durante apagones o shutdowns. El objetivo de carga de trabajo es explícitamente inferencia IA (cloud gaming, streaming de contenido, model serving) — no entrenamiento, que requiere cómputo centralizado concentrado trabajando en concierto. Cada GPU es ~$10K, y el riesgo de robo se marcó explícitamente. Expertos citados: Ari Peskoe en la Electricity Law Initiative de Harvard sobre el riesgo de concentración de red local ("si hay una manzana que tiene varias casas con estos dispositivos, maximizar cómputo y energía forzaría mucha potencia a esa área local"), y Benjamin Lee en UPenn sobre ataques side-channel ("muchos ataques side-channel requieren proximidad física a la máquina, contra lo cual los data centers pueden protegerse; las GPUs distribuidas en casas individuales son mucho más difíciles de proteger"). Lee también cuestionó si los data centers convencionales de 20MW no podrían lograr beneficios similares sin las complicaciones de despliegue suburbano.
El hilo "la infra IA va a lugares extraños" ahora tiene tres apuestas arquitectónicas concurrentes: orbital (Anthropic-SpaceX-Colossus #799, Google-SpaceX #831, Cowboy Space #818), distribuido-terrestre (el pitch XFRA de SPAN aquí), e hyperscale continuo (Microsoft Stargate, Meta, los propios data centers de Google). SPAN está en un lugar interesante — no persigue cómputo de entrenamiento (las apuestas orbital e hyperscale hacen eso), apunta a inferencia en el borde. La advertencia de Lee es el punto arquitectónico más importante: las cargas de inferencia varían considerablemente en requisitos de cómputo (Q&A de documentos vs generación de código vs conversación multi-turno) y la suposición de conectividad de red es portante. Si SPAN puede entregar inferencia de baja latencia más barato que los data centers centralizados pueden enviar la misma carga sobre fibra backbone, la apuesta funciona. Si no, esto arriesga ser el manual de crypto-mining de consumidor con una etiqueta diferente — Helium para IoT, recompensas de gaming GPU mining, los esquemas de cómputo distribuido generalmente no entregaron en sus pitches de cómputo descentralizado una vez que los incentivos de tokens se desgastaron. El pitch de SPAN no tiene token, solo subsidios de utilidades, lo cual es estructuralmente más limpio pero no cambia la pregunta fundamental de si la economía de inferencia distribuida funciona.
Piloto de 100 casas este año, 80K nodos para 2027 es la proyección (logro no confirmado). Estructura de compensación (tarifa de $150 o gratis, utilidades subsidiadas, batería de 16 kWh y panel inteligente gratuitos) es el pitch al propietario. Riesgos marcados en el artículo: concentración local de red de utilidad, ataques side-channel en GPUs físicamente accesibles, robo de GPUs de $10K cada una (comentaristas en Reddit especulando ya), oposición de HOA. Para todos los que observan la infraestructura IA: SPAN es la apuesta distribuida-terrestre junto a orbital y hyperscale, y la inferencia-en-el-borde tiene un caso técnico real si la economía unitaria se alinea. La afirmación de 5× más barato de la entrevista CNBC es el número que quiere verificación independiente antes de ser tratado como establecido. Si se sostiene, esto redistribuye una porción significativa de inversión en infraestructura IA hacia el despliegue residencial. Si no, lo sabremos para 2027 cuando se suponía que aterrizara la meta de 80K. El caso de agua de QTS Georgia de 30M de galones (#816) y la ola de data centers orbitales hacen este camino distribuido-terrestre más plausible de lo que habría parecido hace 18 meses — la oposición comunitaria a la construcción hyperscale es real y creciente, y el pitch de SPAN apunta explícitamente a sortearla.
