人工神经网络工作原理

陌上秋草

<h5>刘桓中,2025年8月</h5> AI要尽量模仿大脑,这出自一条基本信念:大脑是长期进化的产物,进化的本质是优化,所以大脑的结构和工作方式是高度优化的,模仿大脑大概率不会走弯路。<div><br> 但科学界对大脑的认知尚不够深入,人工神经网络只能大致模仿生物神经网络,很多处理方法是科学界自定的,可以说是为实现目标的权宜之计。看眼下,这些权宜之计还能自洽。比如用简单的数学公式模拟神经信号传递,不完美,却能解决图像识别、语言翻译等问题。因此 AI 才能取得令世人瞩目的成就。</div><div><br>许多人对 AI 非常感兴趣,却又感觉这个门槛太高,不敢踏入。我尝试把人工神经网络简化到极致,介绍其工作原理。希望能以此把门槛大大降低,降到不令人生畏的程度。<br></div><div><br></div> <h1><b>极简神经网络实例</b></h1> 先看一个极简神经网络实例。它简化到只有一个神经元,但可以演示神经网络做决策规划的基本方法。<div><br>假设要根据天气来决定是否出门,只考虑气温和风力两个参数。将两个参数值导入神经元,按以下公式整合后得到计算结果:</div><div><br><h5><b><i>是否适合出门 = 气温 X 权数1 + 风力 X 权数2 + 偏置值</i></b></h5></div><div><br>假如权数1 = 0.8,权数2 = 0.3,偏置值 = 0.5,此公式可以写成</div><div><br><h5><b><i>是否适合出门 = 气温 X 0.8 + 风力 X 0.3 + 0.5</i></b></h5></div> <h5><b>极简神经网络实例</b></h5> 当计算结果超过某个设定阈值后,最终决策是不适合出门。<div><br>从公式中不难看出,两个权数用来设定气温和风力这两个参数的权重。权重较大者对计算结果影响也大。如果更看重风力的影响,可以减小权数1,增大权数2。偏置值没有特别意义,就是用来微调计算结果,使其更适合设定的阈值。<br></div><div><br></div> <h1><b>动态调整神经网络</b></h1> 神经网络的初始状态不一定适合实际需要。每次导入参数完成计算后,系统会自动核查。如果发现问题,系统将自动调整权数1、权数2和偏置值。前面的计算过程称为前向传播,后面的核查过程称为反向传播。<div><br>反向传播并不传播数据,只是从后向前一步步核查,找到问题的根源。如同会计账目发现问题,会从总账到明细账再到记账凭证,按此路径反向核查。反向核查会很快发现问题根源。</div><div><br>神经网络的反向传播就是一个自学习过程。神经网络是通过海量数据的训练一步步建成的。训练之初,很多设定值都是暂定值,有些就是随机设定的。</div><div><br>训练神经网络之前,开发者会把海量数据分成许多批次,每次前向传播用一个批次。前向传播完成后自动开启反向传播,对设定数值做调整,然后用下一批次数据开始新循环。经过多次循环,反复调整,设定数值一步步趋向合理,整个神经网络也随之走向成熟。<br></div><div><br></div> <h1><b>扩展的极简神经网络</b></h1> 再看一个稍微复杂些的实例。假定上面的例子增加一个输入参数,共有三个参数:气温、风力和降雨概率,情况要复杂些。为判断是否出门,更需要综合权衡。为此引入了一个中间层,行话叫做隐藏层。它就是个预处理器,先做一番计算,然后把计算结果交给输出层去整合。 <h5><b>增加隐藏层的极简神经网络</b></h5> 输入层就像个分流电路,它将输入参数值分别送到隐藏层的相关神经元。例如,隐藏层的三个神经元可分别按下述不同公式运算:<div><br><h5><i><b> 结果1 = 气温 X 0.8 + 风力 X 0.5 + 降雨概率 X 0.1 + 偏置值1<br></b><b>结果2 = 气温 X 0.1 + 风力 X 0.8 + 降雨概率 X 0.6 + 偏置值2<br></b><b>结果3 = 气温 X 0.7 + 风力 X 0.1 + 降雨概率 X 0.8 + 偏置值3</b></i></h5><br></div><div>稍微留意下公式中的权数,不难发现,三个神经元的侧重点不同。第一个侧重气温和风力,第二个侧重风力和降雨,第三个侧重气温和降雨。把各自计算结果交给输出层去处理。输出层也有自己的考虑,例如,输出层可按以下公式计算:</div><div><br><h5><b><i> 最终结果 = 结果1 X 0.7 + 结果2 X 0.5 + 结果3 X 0.3 + 偏置值 </i></b></h5><br></div><div>隐藏层也可以简化下,只用两个神经元计算,留一个神经元备用。这样就增加了系统的弹性。如果输入层有更多参数进来,备用神经元就能派上用场,无需大幅改变系统结构。<br></div><div><br></div> <h1><b>真正的大脑神经网络如何工作?</b></h1> 以上只是人工神经网络的极简版,所处理的也不过是一个简单决策。不难想到,若是处理复杂问题,势必会涉及大量数学运算。大脑神经网络也是这样工作吗?<div><br>自然界的产物看上去非常复杂,生命就是个例子。然而这只是假象,世界的复杂是由于我们尚无足够认知。一旦看透一件事,它会变得简单明了。自然界的复杂现象追到底往往包含简单的底层机理。生命的底层机理就是DNA(脱氧核糖核酸)。一旦DNA编码被破译,复杂的生命结构和生命形式将大白天下,看上去十分简单。<br></div> <h5><b>大脑神经网络的工作方式</b></h5> 大脑神经网络也是这样,它本质上就是神经元相互连接组成的网络,一切概念一切思维均由神经元的连接构成。“天气热”这个抽象概念是由若干具体概念共同形成,如“烈日当空”、“汗流浃背”和摄氏30度以上。这些概念相互关联,便构成了“天气热”概念。<div><br>“不宜出门”在大脑中是另外一个概念。生活经历会将“天气热”和“不宜出门”相关联,多次经历会使二者形成强连接,在大脑中成为强化记忆,也就是常说的“经验”。有了这种强连接,只要出现“天气热“这种前提条件,立即会激活”不宜出门“这种反应。<br></div><div><br></div> <h1><b>人工神经网络把事情搞复杂了</b></h1> 人工神经网络要依托价格昂贵的硬件系统,还要像大型制造业那样吞吃电力。比起人的大脑来,实在是太落后了。人工系统唯一优势就是计算速度。利用这一点,可以设计出精巧的计算机算法,利用较少算力资源实现强大功能。人工神经网络包含很多人为设计成分,其结构和工作程序都比大脑神经网络复杂得多。<div><br>这些人为设计只是权宜之计。本来那些硬件只能搞出猿猴智能,非得搞成人的大脑,不得不这样做。看长远,从微观层面仿真人的大脑是一条更有前途的路径。</div><div><br>随着微电子技术的进步,已有研究者利用类脑计算机在做这件事(关于类脑计算机,可参阅我另一篇文章:<a href="https://www.meipian.cn/5fjk9qv1?share_depth=1" target="_blank" class="link"><i class="iconfont icon-iconfontlink"> </i>《人造大脑正向我们走来》</a>)。不难预测,AI 的生成和运行机制会越来越像人的大脑,加上 其速度优势和网络协同优势,AI 全面超越人类大脑已为期不远。<br></div>