神经元：定义与含义 — AI 维基

神经网络的基本计算单元。人工神经元接收输入，将每个输入乘以一个权重，求和后加上偏置，再通过激活函数产生输出。成千上万到数十亿个这样的神经元，按层组织并通过学习得到的权重相连，构成了驱动所有现代AI的神经网络。

为什么重要

神经元是深度学习的原子。理解单个神经元——加权求和加激活——就能直观理解神经网络架构的其余部分。层是一组神经元，网络是层的堆叠，训练是调整权重。其他一切都是细节（重要的细节，但终究是细节）。

深度解析

人工神经元是受生物神经元的松散启发，但不应将其视为字面类比。生物神经元通过树突接收电信号，在细胞体中整合，并通过轴突发射（或不发射）信号。人工神经元的计算方式为：输出 = 激活函数(w1·x1 + w2·x2 + ... + wn·xn + 偏置)。权重(w)决定了每个输入的重要程度。偏置移动激活阈值。激活函数（ReLU、GELU）引入非线性。

从感知机到深度学习

感知机（Rosenblatt，1958）是第一个人工神经元——一个能够学习对线性可分数据进行分类的单元。Minsky和Papert在1969年证明单个感知机无法学习XOR（一个简单的非线性函数），这促成了第一次AI寒冬。解决方案是：堆叠多层神经元（多层感知机/MLP），在足够多的神经元条件下可以学习任何函数。这就是万能近似定理——深度学习的理论基础。

现代LLM中的神经元

像Llama-70B这样的模型大约有700亿个参数（连接神经元的权重和偏置）。每个前馈层有数千个神经元。但现代研究表明，单个神经元通常并不对应单一概念——相反，概念被编码为跨多个神经元的激活空间中的方向（叠加态）。一个神经元可能同时参与编码数十种不同的特征，这使得解释变得具有挑战性。

神经元

为什么重要

深度解析

从感知机到深度学习

现代LLM中的神经元

相关概念