深度学习革命：神经网络

蓝天白云

<h3>罗森布拉特的感知机被技术权威明斯基打进了冷宫。然而，是金子总会发光。后来的研究人员默默的整理感知机的资料，在罗教授去世三年后，1974年哈佛大学的博士生沃泊斯Werbos等人继续研究感知机。他们首先，把婴幼儿的眼睛、大脑、和嘴巴</h3> <h3>在识别妈妈和叫出妈妈的过程，</h3> <h3>用三列神经元来表征。把婴幼儿的眼睛用第一列神经元，大脑用第二列神经元，嘴巴用第三列神经元表示。三列神经元之间用权值联接起来，调整计算权值就是表征婴幼儿记忆感觉和认识妈妈过程，即感知机的学习过程通常采用监督学习的方式，通过不断调整权值，使得在给定输入数据时能够输出正确的输出结果‌，这就是罗森布拉特最伟大的发明《新计算范式》，用感知机实现机器学习。</h3> <h3>即按罗森布拉特的思想，抽象成神经网络，第一列红色的神经元表示婴幼儿的眼睛，第二列黄色的神经元表示婴幼儿的大脑，第三列蓝色的神经元表示婴幼儿的嘴，权值即每列神经元之间联接线（黑色）上的值，见上两图比较。作者不厌其烦地重复这三列神经元表示婴幼儿的眼、脑和嘴，就是让看官你也感觉出来了，为什么文明斯基会发现它只能是婴幼儿的大脑水平！因为描述大脑的黄色一列神经元太少了呀！恭喜看官，你也有获诺贝尔奖的天赋了！</h3> <h3>先来看文斯基怎么样发现感知机至多能描述婴幼儿脑的，即只有线性分类能力。这里每个皮茨M-P神经元如下定义，这里输入xi表示婴幼儿的眼睛见到妈妈的像素，wl表示赫布权值，将像素按比例送到大脑神经元中，神经元处理比例后的像素，转换成y指挥嘴，叫出“妈妈”或不叫。</h3> <h3>即见下图，当绿色圆为一类，棕色圆为另一类时时，你可以用一条直线把两类元分开（直线的一边是绿色圆，另一边是棕色圆），即可线性分类。经过学习，即调整权值，感知机能找到这条直线。</h3> <h3>但对于下面的图，当绿色圆为一类，棕色圆为另一类时，无论怎样学习，感知机都无法找到一条直线，能把它们进行正确分类，但是必须要两条直线才能把它们进行正确分类。这就是明斯基发现并证明感知机的缺陷。</h3> <h3>哪儿去找那最二根直线呢？1974年，沃泊斯跟你一样，突然灵光一闪，描述婴幼儿大脑的黄色一列神经元太少了！随着年龄增长，神经元会增加的呀！加一列黄色神经元不就行了吗！从而他构造了下面的神经网络，即增加了一列黄色神经元。</h3> <h3>这就是沃泊斯找到的两层感知机弥补了单层感知机的缺陷，即可产生非线性分类能力（找到了可以用于分类的曲线）。但是，由于对感知机的偏见观点惯性作用，这个结果没有引起人们的关注。</h3> <h3>但是，这个结果却引起了辛顿的注意，</h3> <h3>十二年后，辛顿在1986年把沃泊斯的成果更一般化，并推广到任意层的神经网络，并将激活函数连续化，给出了通用反向传播算法BP，即求权值的关键两步：1 用损失函数求最小值；2 梯度迭代。还证明了其收敛性。</h3> <h3>1989年，尼尔森又证明了，神经网络是万能逼近机，即可以逼近任何连续函数。在这些研究成果的基础之上，2006年，辛顿又推进到玻兹曼神经网络：2010年，辛顿的博士后杨立昆又推进到卷积神经网络。</h3> <h3>2012年，雷达（千里眼）和声纳（顺风耳）研究终于在辛顿和他的两个博士的研究成就带来了突破，解决了军方的大难题，从此引发了深度革命，参看张老师写的《深度学习是什么？何为深度？》和《双奖得主艰辛历程与成功启迪1》。</h3> <h3>今年2024年诺贝尔奖授予辛顿，加上2018年授予他图灵奖，表彰他带来的深度学习革命。通过下面的比较，你才能理解这次革命对人类文明进步是划时代的！<br>解放人类体力劳动的工业革命：牛顿力学（1687年）→瓦特蒸汽机（1776年）→法拉第电动机（1821年）→本茨汽车（1886年）→查达拖拉机（1889年）→莱特飞机（1903年）。<br>解放人类脑力劳动的深度学习革命：麦克洛克皮茨神经元（1943年）→赫布权值（1948年）→罗森布拉特感知机（1958年）→沃泊斯多层感知机（1974年）→辛顿BP机（1986年）→尼尔森万能逼近机（1989年）→辛顿玻兹曼机（2006年）→辛顿卷积神经机（2012年）→阿尔法狗（2016年）→ChatGPT（2022年）。</h3>