La startup San Francisco SPAN a annoncé cette semaine un pitch compute IA distribué : installer des nœuds GPU XFRA — 16 NVIDIA RTX Pro 6000 Blackwell Server Edition plus 4 AMD EPYC CPUs plus 3 To de mémoire par nœud, refroidis par liquide, faible bruit — à côté des maisons nouvellement construites, payer les factures d'électricité et internet des propriétaires plus un frais fixe de 150 $ (ou rien possiblement), et passer à 80 000 nœuds d'ici 2027 pour plus d'un gigawatt de compute distribué. Un pilote de 100 maisons lance cette année. Le VP Chris Lander a dit à Ars : « Les data centers sont bruyants, laids, et font souvent monter les factures d'électricité locales. [Ceci] est silencieux, discret, et rend l'énergie plus abordable pour l'hôte et la communauté. » SPAN revendique 5× moins cher que construire un data center équivalent de 100MW, selon leur interview CNBC.

Les spécificités d'ingénierie comptent parce qu'elles décident si l'économie unitaire fonctionne. Chaque nœud XFRA tire jusqu'à 80 ampères, ce qui entre dans le standard de service résidentiel 200 ampères que la plupart des maisons US construites les 30 dernières années ont (Lander dit que « 80 ampères disponibles à tout moment » est typique). Une batterie 16 kWh, un panneau intelligent SPAN, et le logiciel PowerUp gèrent la charge à chaque maison. Dans les rares pics résidentiels, le système utilise d'abord la batterie maison ; dans les cas extrêmes, il limite les « charges flexibles non-critiques » comme la charge de VE, avec priorités réglables par le propriétaire. Le réseau déplace la charge vers d'autres nœuds pendant les pannes ou shutdowns. La cible de charge de travail est explicitement l'inférence IA (cloud gaming, content streaming, model serving) — pas l'entraînement, qui requiert du compute centralisé concentré travaillant de concert. Chaque GPU est ~10K $, et le risque de vol a été signalé explicitement. Experts cités : Ari Peskoe à l'Electricity Law Initiative de Harvard sur le risque de concentration grille locale (« s'il y a un pâté de maisons qui a plusieurs maisons avec ces appareils, maximiser compute et énergie forcerait beaucoup de puissance vers cette zone locale »), et Benjamin Lee à UPenn sur les attaques side-channel (« beaucoup d'attaques side-channel requièrent proximité physique avec la machine, ce contre quoi les data centers peuvent se protéger ; les GPU distribués dans des maisons individuelles sont beaucoup plus difficiles à protéger »). Lee a aussi questionné si les data centers conventionnels de 20MW ne pourraient pas atteindre des bénéfices similaires sans les complications de déploiement suburbain.

Le fil « l'infra IA va dans des endroits étranges » a maintenant trois paris architecturaux concurrents : orbital (Anthropic-SpaceX-Colossus #799, Google-SpaceX #831, Cowboy Space #818), distribué-terrestre (le pitch XFRA de SPAN ici), et hyperscale continu (Microsoft Stargate, Meta, les data centers de Google). SPAN est à une place intéressante — il ne court pas après le compute d'entraînement (les paris orbital et hyperscale font ça), il cible l'inférence en bordure. La mise en garde de Lee est le point architectural le plus important : les charges d'inférence varient considérablement dans les exigences compute (Q&A document vs génération de code vs conversation multi-tour) et l'assomption de connectivité réseau est porteuse. Si SPAN peut livrer de l'inférence basse-latence moins cher que les data centers centralisés peuvent shipper la même charge sur fibre backbone, le pari marche. Sinon, ça risque d'être le playbook crypto-mining consommateur avec un sticker différent — Helium pour IoT, récompenses GPU gaming mining, les schèmes compute distribués n'ont généralement pas livré sur leurs pitches compute-décentralisé une fois que les incitatifs token se sont usés. Le pitch de SPAN n'a pas de token, juste des subventions utilities, ce qui est structurellement plus propre mais ne change pas la question fondamentale de si l'économie d'inférence distribuée marche.

Pilote 100 maisons cette année, 80 000 nœuds d'ici 2027 est la projection (réalisation non confirmée). Structure de compensation (frais 150 $ ou gratuit, utilities subventionnés, batterie 16 kWh et panneau intelligent gratuits) est le pitch propriétaire. Risques signalés dans l'article : concentration grille utility locale, attaques side-channel sur GPUs physiquement accessibles, vol de GPUs à 10K $ chacun (commentateurs Reddit spéculant déjà), opposition HOA. Pour tous ceux qui regardent l'infrastructure IA : SPAN est le pari distribué-terrestre à côté de l'orbital et de l'hyperscale, et l'inférence-en-bordure a un vrai cas technique si l'économie unitaire s'aligne. La revendication 5× moins cher de l'interview CNBC est le chiffre qui veut une vérification indépendante avant d'être traité comme établi. S'il tient, ça redistribue un morceau significatif d'investissement en infrastructure IA vers le déploiement résidentiel. Sinon, on saura d'ici 2027 quand la cible 80K était censée atterrir. Le cas eau QTS Georgia 30M gallons (#816) et la vague data center orbital rendent ce chemin distribué-terrestre plus plausible qu'il ne l'aurait paru il y a 18 mois — l'opposition communautaire à la construction hyperscale est réelle et grandissante, et le pitch de SPAN vise explicitement à la contourner.