剑桥大脑启发芯片:AI 能耗降低 70%,但有 700°C 制造障碍, Zubnet AI 新闻

剑桥的材料科学与冶金系在 Science Advances 上发表了一篇 paper,描述了一种 memristor — 一种把内存和计算结合在同一位置的芯片组件 — 由改性的铪氧化物构建。数字令人印象深刻:switching 电流比传统氧化物 memristors 低约一百万倍,数百个稳定的不同模拟电导级别(而不是二进制开/关),以及一个头条声明,即与当前数字芯片相比,AI 能耗减少高达 70%。机制类似于大脑突触如何工作 — 渐进的、连接强度的模拟调整,而不是离散的数字状态。首席作者 Dr. Babak Bakhit 注意到主要障碍:制造过程目前需要约 700°C 的温度,这与上限较低的标准半导体制造线不兼容。

这是什么和不是什么。Memristors 并不新 — 1971 年理论上被描述,2008 年物理实现 — 但实用、节能、可制造的 memristors 是二十年来的研究前沿。剑桥的贡献是材料科学:不是依靠丝状 switching(其中微小的导电路径形成和断裂,这很挑剔且高能耗),他们用添加的锶和钛加上两步生长过程工程化了铪氧化物,在界面处创建 p-n 结 — 像标准半导体电子学中已经存在的门的微观版本。这个选择给了他们「内存内计算」所需的稳定模拟级别,在那里相同的物理组件存储数据并做数学,消除了现代芯片大部分能源预算所消耗的内存和处理器之间的往返。70% 数字作为对一般神经形态计算的类别声明是有意义的,作为这个特定设备相对于特定基线的经验证属性则较少。

这对非专业人士为什么重要。AI 的能源足迹已成为真正的公共对话 — 数据中心购买核 PPA、town boards 因用水用电拒绝计算 facilities、前沿 labs 公开谈论轨道数据中心,因为陆地约束在咬人。当前架构(内存和计算分离,数据在它们之间穿梭)是使 AI 如此饥渴能源的原因,而不是数学本身。原则上,在原地计算的神经形态芯片可以将 AI 推理的电费切一个数量级,就像大脑以约 20 瓦运行,而 Llama 级模型需要千瓦进行类似推理一样。这个特定的剑桥设备是否到达那里或保持作为研究原型,几乎完全取决于是否有人可以重新工程化制造以在标准 CMOS 温度(低于约 450°C)下运行。多个 labs 正在研究低温 memristor 工艺;剑桥团队不声称他们已经破解了那个,只是他们有一个稳定的模拟设备,一旦解决温度问题就值得集成。

实际预期。神经形态计算已经「五年后」十五年了;这篇 paper 没有戏剧性地改变那个时间线。它做的是在可能在规模上工作的方法管线中添加另一个可信架构,与 Intel 的 Loihi、IBM 的 NorthPole 和各种创业努力(Rain AI、BrainChip、Synthara)并列。对日常用户,诚实的期望是接下来三年的 AI 能源效率改进将来自算法优化(model distillation、speculative decoding、KV cache 压缩)和更好的数字硅(Blackwell → Rubin、AMD MI400、Google TPU 8),而不是神经形态芯片。过了 2028,如果 labs 能解决剑桥 paper 强调的制造温度约束,神经形态加速器可能从研究移到专门部署 — 可能首先在边缘设备(always-on voice、传感器分析),那里节省瓦特的数学最具说服力,只有后来在数据中心推理中。这篇 paper 是真实进步;时间线仍以芯片代际衡量,不是产品周期。

剑桥大脑启发芯片:AI 能耗降低 70%,但有 700°C 制造障碍

更多新闻