9.10 卷积网络的神经科学基础
卷积网络也许是生物学启发人工智能的 为成功的案例。虽然卷积网络也经过
许多其他领域的指导,但是神经网络的一些关键设计原则来自于神经科学。
卷积网络的历史始于神经科学实验,远早于相关计算模型的发展。为了确定关
于哺乳动物视觉系统如何工作的许多 基本的事实,神经生理学家 David Hubel 和
Torsten Wiesel 合作多年 (Hubel and Wiesel, 1959, 1962, 1968)。他们的成就 终获
得了诺贝尔奖。他们的发现对当代深度学习模型有 大影响的是基于记录猫的单个
神经元的活动。他们观察了猫的脑内神经元如何响应投影在猫前面屏幕上精确位置
的图像。他们的伟大发现是,处于视觉系统较为前面的神经元对非常特定的光模式
(例如精确定向的条纹)反应 强烈,但对其他模式几乎完全没有反应。
他们的工作有助于表征大脑功能的许多方面,这些方面超出了本书的范围。从
深度学习的角度来看,我们可以专注于简化的、草图形式的大脑功能视图。
在这个简化的视图中,我们关注被称为 V1 的大脑的一部分,也称为初级视觉
皮层(primary visual cortex)。V1 是大脑对视觉输入开始执行显著高级处理的第一
个区域。在该草图视图中,图像是由光到达眼睛并刺激视网膜(眼睛后部的光敏组
织)形成的。视网膜中的神经元对图像执行一些简单的预处理,但是基本不改变它
被表示的方式。然后图像通过视神经和称为外侧膝状核的脑部区域。这些解剖区域
的主要作用是仅仅将信号从眼睛传递到位于头后部的 V1。
卷积网络层被设计为描述 V1 的三个性质:
1. V1可以进行空间映射。它实际上具有二维结构来反映视网膜中的图像结构。例
如,到达视网膜下半部的光仅影响 V1 相应的一半。卷积网络通过用二维映射
定义特征的方式来描述该特性。
2. V1 包含许多简单细胞(simple cell)。简单细胞的活动在某种程度上可以概括
1