A startup de São Francisco SPAN anunciou esta semana um pitch de computação IA distribuída: instalar nós GPU XFRA — 16 NVIDIA RTX Pro 6000 Blackwell Server Edition mais 4 AMD EPYC CPUs mais 3 TB de memória por nó, resfriados a líquido, baixo ruído — ao lado de casas recém-construídas, pagar as contas de eletricidade e internet dos proprietários mais uma taxa fixa de $150 (ou possivelmente nada), e escalar para 80.000 nós até 2027 para mais de um gigawatt de computação distribuída. Um piloto de 100 casas começa este ano. O VP Chris Lander disse à Ars: "Data centers são barulhentos, feios e frequentemente elevam as contas locais de eletricidade. [Isso] é silencioso, discreto e torna a energia mais acessível para o anfitrião e a comunidade." A SPAN afirma 5× mais barato que construir um data center equivalente de 100MW, segundo sua entrevista na CNBC.

As especificidades de engenharia importam porque decidem se a economia unitária funciona. Cada nó XFRA consome até 80 amperes, o que cabe no padrão de serviço residencial de 200 amperes que a maioria das casas dos EUA construídas nos últimos 30 anos têm (Lander diz que "80 amperes disponíveis a todo momento" é típico). Uma bateria de 16 kWh, um painel inteligente SPAN, e o software PowerUp gerenciam a carga em cada casa. Em picos residenciais raros, o sistema usa primeiro a bateria da casa; em casos extremos, recorta "cargas flexíveis não-críticas" como carregamento de VE, com prioridades configuráveis pelo proprietário. A rede move a carga para outros nós durante quedas ou shutdowns. O objetivo de carga de trabalho é explicitamente inferência IA (cloud gaming, streaming de conteúdo, model serving) — não treinamento, que requer computação centralizada concentrada trabalhando em concerto. Cada GPU é ~$10K, e o risco de roubo foi marcado explicitamente. Especialistas citados: Ari Peskoe na Electricity Law Initiative de Harvard sobre o risco de concentração de rede local ("se há um quarteirão que tem várias casas com esses dispositivos, maximizar computação e energia forçaria muita potência para aquela área local"), e Benjamin Lee na UPenn sobre ataques side-channel ("muitos ataques side-channel exigem proximidade física com a máquina, contra o que data centers podem se proteger; GPUs distribuídas em casas individuais são muito mais difíceis de proteger"). Lee também questionou se data centers convencionais de 20MW não poderiam alcançar benefícios similares sem as complicações de implantação suburbana.

O fio "a infra IA vai a lugares estranhos" agora tem três apostas arquitetônicas concorrentes: orbital (Anthropic-SpaceX-Colossus #799, Google-SpaceX #831, Cowboy Space #818), distribuído-terrestre (o pitch XFRA da SPAN aqui), e hyperscale contínuo (Microsoft Stargate, Meta, os próprios data centers do Google). A SPAN está em um lugar interessante — não persegue computação de treinamento (as apostas orbital e hyperscale fazem isso), mira inferência na borda. O alerta de Lee é o ponto arquitetônico mais importante: cargas de inferência variam consideravelmente em requisitos de computação (Q&A de documentos vs geração de código vs conversação multi-turno) e a suposição de conectividade de rede é portante. Se a SPAN puder entregar inferência de baixa latência mais barato que data centers centralizados podem enviar a mesma carga sobre fibra backbone, a aposta funciona. Se não, isso arrisca ser o manual de crypto-mining de consumidor com um adesivo diferente — Helium para IoT, recompensas de gaming GPU mining, esquemas de computação distribuída geralmente não entregaram em seus pitches de computação descentralizada uma vez que os incentivos de token se desgastaram. O pitch da SPAN não tem token, apenas subsídios de utilidades, o que é estruturalmente mais limpo mas não muda a questão fundamental de se a economia de inferência distribuída funciona.

Piloto de 100 casas este ano, 80K nós até 2027 é a projeção (realização não confirmada). Estrutura de compensação (taxa de $150 ou grátis, utilidades subsidiadas, bateria de 16 kWh e painel inteligente gratuitos) é o pitch ao proprietário. Riscos marcados no artigo: concentração local de rede de utilidade, ataques side-channel em GPUs fisicamente acessíveis, roubo de GPUs de $10K cada (comentaristas no Reddit já especulando), oposição de HOA. Para todos observando a infraestrutura IA: a SPAN é a aposta distribuído-terrestre ao lado de orbital e hyperscale, e inferência-na-borda tem um caso técnico real se a economia unitária se alinhar. A afirmação de 5× mais barato da entrevista CNBC é o número que quer verificação independente antes de ser tratado como estabelecido. Se sustentar, isso redistribui uma porção significativa de investimento em infraestrutura IA para a implantação residencial. Se não, saberemos até 2027 quando a meta de 80K deveria aterrissar. O caso de água QTS Georgia de 30M galões (#816) e a onda de data centers orbitais tornam esse caminho distribuído-terrestre mais plausível do que teria parecido 18 meses atrás — a oposição comunitária à construção hyperscale é real e crescente, e o pitch da SPAN mira explicitamente em contorná-la.