Zubnet AI学习Wiki › 特征
基础

特征

别名:学习表示、激活
神经网络学会在其输入中检测的模式或概念。在视觉中,早期层特征是边缘和纹理;后期层特征是物体部分和完整物体。在语言模型中,特征从简单的(字母“a”、特定的语法模式)到抽象的(讽刺的概念、特定的推理策略)。特征表示为跨神经元的激活模式。

为什么重要

特征是模型真正学习的东西——不是单个事实而是可泛化的模式。模型不会记住“猫有毛”;它学习一个毛状纹理的特征检测器,对猫、狗和泰迪熊都会激活。理解特征有助于解释模型行为:为什么它能泛化(特征迁移)、为什么它失败(错误的特征被激活)、以及如何改进它(让它接触更多样化的特征)。

深度解析

“特征”一词在不同语境中有不同含义。在经典机器学习中,特征是手工设计的输入变量(身高、体重、年龄)。在深度学习中,特征是隐藏层中的学习表示——模型自行发现有用的模式。这种从手工设计到学习特征的转变是深度学习的核心创新,也是它在视觉和语言等复杂任务上超越经典ML的原因。

层次化特征

深度网络学习层次化特征:每层建立在前一层的基础上。在视觉模型中:第1层检测边缘,第2层将边缘组合成纹理和角落,第3层将纹理组合成物体部分(眼睛、车轮),第4层将部分组合成物体(面孔、汽车)。这种层次结构从训练中自动涌现——没有人编程它。同样的层次化特征学习在语言模型中也发生,从字符模式到语法到语义到推理。

特征可视化

研究人员可视化特征以理解模型学到了什么。对于视觉模型,你可以生成最大激活特定神经元或方向的图像,揭示它检测的模式。对于语言模型,你可以找到最大激活特定特征方向的文本示例。Anthropic的研究已在Claude中可视化了特征,发现了“金门大桥”、“代码bug”、“欺骗”和“法语语言”等可解释概念被编码为模型激活空间中的特定方向。

相关概念

← 所有术语
← 温度 状态空间模型 →