现代数学的基石—李理论

胡刚

<p class="ql-block" style="text-align:center;"><b>现代数学的基石—李理论</b></p> <p class="ql-block"><span style="color:rgb(22, 126, 251);">李理论</span>(Lie theory),命名自19世纪的挪威数学家索菲斯·李,是数学和物理学中一个极其重要且广泛应用的理论,其根本概念是<span style="color:rgb(22, 126, 251);">李群</span>和<span style="color:rgb(22, 126, 251);">李代数</span>。这个理论提供了一个强大的框架,用于描述<span style="color:rgb(22, 126, 251);">对称性</span>和<span style="color:rgb(22, 126, 251);">连续变换</span>,因此在许多科学领域中都有着广泛的应用,包括量子力学、粒子物理、晶体学和机器人学。</p><p class="ql-block">在谷歌中搜索“李理论”,会出现图片:</p> <p class="ql-block">它使得该理论看起来比实际上更难。然而,如果熟悉复数,那么已经遇到了一个例子,那就是那些于模为1的复数,你的本能反应可能是将这些数字视为 e^(i θ):</p> <p class="ql-block">如果更深入地思考,实际上是在这个复数圆上施加了一个坐标系统,例如,我们可以说这一点是 e^(i * 0.7π):</p> <p class="ql-block">这个圆是所谓的李群(Lie group)的一个例子。但一般来说,它可以是更高维的,更难以可视化的。李理论的精髓是,即使在这些复杂的情况下,也要尽量施加一个坐标系统,使其更容易处理。</p><p class="ql-block">让我们稍微详细地阐述李理论,从李群开始。<span style="color:rgb(22, 126, 251);">李群同时是两个东西,它是一个群,但也是一个流形</span>。</p> <p class="ql-block"><b>李群-群</b></p><p class="ql-block">首先让我们了解一下什么是群,因为它是一个更容易的概念。</p><p class="ql-block">群基本上是一组满足某些属性的对象,使它们看起来具有对称性。我们期望对称性满足的第一个属性是封闭性。以正三角形的对称性G为例,我们将 h 表示为沿斜轴的反射对称性,g 表示为沿垂直轴的另一个反射对称性,那么将 g · h 定义为函数组合,即首先做 h,然后做 g。事实证明,g 和 h 组合是一个旋转。结果不重要,重要的是结果仍然是一个对称性,因此它仍然在 G 中。</p> <p class="ql-block">但为了使这个公理成立,我们需要对每对 g 和 h 都证明这一点。你可以逐个验证这个情况,但根据定义,对称性是任何保持对象不变的变换。所以如果 g 和 h 是对称的,它们保持对象不变,那么当然,先做 h 然后做 g 也会保持对象不变,因此也是一个对称性。</p><p class="ql-block">对称性还遵循一些其他属性,如“结合律”:</p> <p class="ql-block">如存在一个恒等元:</p> <p class="ql-block">最后,对称性都有一个逆:</p> <p class="ql-block">如果一组对象满足这4个条件,它就构成一个群。一个对象的对称性自然地形成一个群。如果给定一组数字或矩阵,比如一开始的复数单位圆,检查该集合是否满足这些属性是很有必要的。在这种情况下,你只需要使用模数相乘,甚至不需要用欧拉公式,</p> <p class="ql-block">当然,不仅仅是这个圆形成了一个群。旋转矩阵的集合,正交或酉矩阵都是群,</p> <p class="ql-block">如果你对群不太熟悉,我强烈建议你对这些集合的群公理进行补习。你所需要的只是转置、伴随和行列式的一些其他属性,</p> <p class="ql-block">总之,群只是李理论的一部分。李群也是流形,那么什么是流形呢?让我们通过一个例子来理解:复数的圆。</p> <p class="ql-block">这个圆是流形,意思是在它上面的每一点,其邻域基本上看起来像一条线,只是变形了。让我们放大这一点的邻域。</p> <p class="ql-block">在圆的情况下,这是一个弧,可以平滑地变形为直线。</p> <p class="ql-block">但同样重要的是,这条线也可以平滑地变回弧。这种双向变形就是我所说的“看起来像一条线”。当然,不仅仅是圆上的这一特定点。每个点都有这样的属性,即邻域看起来像一条线。这就是我们称<span style="color:rgb(22, 126, 251);">圆为一维流形</span>(1-dimensional manifold)的原因。</p><p class="ql-block">但是还有更高维的流形,道理是一样的。</p> <p class="ql-block">只是任何点的邻域不再看起来像一条线,而是(在这个圆环的情况下)看起来像一个平面。所以,一个圆环的表面是一个<span style="color:rgb(22, 126, 251);">二维流形</span>。一个更奇特的例子是SO(3),三维的旋转。SO(3)看起来像什么呢?</p> <p class="ql-block">对于三维旋转,首先要指明旋转轴,然后是绕这个轴的旋转角度θ。我们可以将这个特定的旋转表示为流形上的一个点,球是一个实心球。球上的相应点将沿着旋转轴的某处。轴上的位置取决于绕这个轴的旋转角度。例如,这个轴上的点,从中心向上的θ单位,对应于沿着这个轴的θ旋转。至于方向,使用右手法则。所以这个点在中心上方,意味着使用右手法则的逆时针旋转。最后,我们将旋转角限制为π,所以如果你的旋转角超过π,那么就朝相反的方向旋转。</p> <p class="ql-block">这就是我们可以从几何上思考SO(3)的方式,但这是一个相当奇怪的几何图形,因为这两个相对的点实际上代表了相同的旋转:</p> <p class="ql-block">毕竟,它们都代表了180度的顺时针或逆时针旋转。你可以把这两个点看作是一个相通的门,当你朝一个方向旋转得越来越多,而且超过了π,那么立即通过门继续向上行进。</p> <p class="ql-block">但这不仅仅是一对点,球的表面上的每一个地方都是一个门,只是旋转轴不同。</p><p class="ql-block">如果听起来很奇怪,那确实是奇怪的,但是,这仍然是一个流形,更具体地说是一个<span style="color:rgb(22, 126, 251);">三维流形</span>,这可以在更高的维度中正确地可视化,但必须在5维空间中才能做到这一点。总的来说,<span style="color:rgb(22, 126, 251);">一个n维流形意味着所有的邻域都“看起来像”n维空间</span>。</p><p class="ql-block">李群同时是群和流形的整体思想意味着两件事:首先,我们不必把这些SO(n)(<span style="color:rgb(22, 126, 251);">正交群</span>)和SU(n)(<span style="color:rgb(22, 126, 251);">酉群</span>)纯粹地看作一堆矩阵,我们可以<span style="color:rgb(22, 126, 251);">几何地思考</span>它们,尽管在更高维的旋转中,它变得不那么可视化。其次,在这两者的交叉口,我们可以使用群论的工具和微分几何的工具,这是流形的研究,来研究它们。李首先将李群视为流形。</p><p class="ql-block"><b>李代数</b></p><p class="ql-block">地球的表面是流形的另一个例子,虽然地球的表面是弯曲的,但是我们可以通过<span style="color:rgb(22, 126, 251);">施加一个坐标系统</span>(例如<span style="color:rgb(237, 35, 8);">经纬度系统</span>)来制作一张平面的地图。这样,我们就可以将复杂的弯曲空间转化为更容易处理的平面空间。这是一个将复杂的几何对象(如地球表面)简化为我们可以更容易处理的对象(如地图)的例子。</p> <p class="ql-block">李的思想是类似的。<span style="color:rgb(22, 126, 251);">李群是复杂的曲面流形</span>,同样,我们要建立一个坐标系统,一个平的空间来处理它,<span style="color:rgb(22, 126, 251);">那个平的空间就是</span><b style="color:rgb(22, 126, 251);">李代数</b>。让我们用更多的细节说明这一点。在李群是复数圆的情况下,坐标系统由1(恒等元)处的切线组成。</p> <p class="ql-block">它的工作原理是将切线向量与圆上的点相对应,这是非常自然的。如果向量的长度是θ,那么我们将它对应到李群上1处距离θ的一个点。</p> <p class="ql-block">实际上,这个向量可以被认为是iθ,</p> <p class="ql-block">这是因为复数不仅是平面上的一点,也可以被认为是从原点到该点的一个向量,</p> <p class="ql-block">所以向上的向量对应于纯虚数,</p> <p class="ql-block">因此,这个向上的切线向量可以被认为是iθ。但是我们说,作为一个坐标系统,切线向量对应于距离恒等元θ的一个点,你知道这个点是什么吗?这正是</p> <p class="ql-block">这也与更一般的李群和李代数的非常相似。</p><p class="ql-block"><b>首先,有一个李群,我们想找到这个群的恒等元(即1)。一旦完成了这个任务,考虑恒等式处的切空间。这个平的空间是对应的李群的李代数。</b></p> <p class="ql-block">李代数作为坐标系统的工作原理是使切空间(即1处的切线)上的切线向量“包装”在李群上,然后取端点。</p> <p class="ql-block">这种<span style="color:rgb(176, 79, 187);">将切线向量对应到流形上的点的“包装”动作</span>称为<span style="color:rgb(22, 126, 251);">指数映射</span>(exponential map)。在这个特定的情况下,向量iθ被包装到李群上的e^(iθ),所以它实际上是一个指数映射。</p> <p class="ql-block">但这种指数映射的概念适用于一般的流形,而不仅仅是李群。</p><p class="ql-block">换句话说,即使对于一般的流形,将切空间上的切线向量映射到流形上的点的动作仍然被称为指数映射,理想情况下,我们希望只使用平的空间,因为它比弯曲的对象更容易处理。</p><p class="ql-block">这个指数映射,或者实际上,其逆映射,或对数映射,将把流形上的一点还原到平坦空间上的一个切线向量。所以,这是理解李群的第一步。把它当作流形,我们想要把李群还原为李代数,通过对数映射,将恒等元处的切空间还原。</p> <p class="ql-block">但是,如果我们把李群当作群,会怎样呢?群公理告诉我们群元素和点乘应满足哪些条件,</p> <p class="ql-block">所以我们关心这样一个群的乘法是如何运算的。</p><p class="ql-block">举例来说,有一个李群,其恒等元用红点表示,对应的李代数,是恒等元处的切空间。中间的红点对应于李群上的恒等元。</p> <p class="ql-block">让我们考虑一对元素g,h,以及它们的乘积g·h。我们可以用<span style="color:rgb(22, 126, 251);">对数映射</span>将所有这些点还原到平坦空间上的切线向量,</p> <p class="ql-block">该映射将所有这些点还原到平坦空间上的切线向量。现在,如果只有对应于g和h的这些切线向量,能否不参考李群,就能确定对应于g·h的切线向量呢?</p> <p class="ql-block">一个天真的猜测可能是</p> <p class="ql-block">但这些g和h是矩阵,它们的乘法方式与数字不同。</p><p class="ql-block">然而,实际上存在一个公式。如果用X表示log g,用Y表示log h,用Z表示log (g·h),那么Z可以作为无穷级数</p> <p class="ql-block">这看起来令人生畏,但可以分解为两个简单的操作:首先,加法或减法。这正是那些切线向量的加法或减法。其次,这些方括号,被称为<span style="color:rgb(22, 126, 251);">李括号</span>(Lie brackets)。目前,你可以将它们视为将两个切线向量变为另一个切线向量的简单但特定的操作。因此,如果我们还知道李括号,那么就知道对应于g·h的切线向量。这个公式,称为Baker-Campbell-Hausdorff公式,简称<span style="color:rgb(22, 126, 251);">BCH公式</span>,使我们能够完全<span style="color:rgb(237, 35, 8);">在李代数上复制群乘法</span>。所以,<span style="color:rgb(237, 35, 8);">我们可以只在李代数上运算,而不是在弯曲的空间上</span>。</p><p class="ql-block">现在,<b>在李群上,群公理告诉我们乘法应该满足什么,而在李代数上,李括号也会相应地满足一些性质。</b></p> <p class="ql-block">目前,这些性质的细节不重要,但要知道,这些李括号的性质通常来自于李群中的乘法性质。识别这些性质是完全放弃李群,只关注李代数的另一步。因此,尽管我们原本想研究李群(因为它是一个更通用的结构),但我们可以转而研究李代数,因为李代数包含了李群的所有重要信息,而且它是一个更简单的结构。如今,大多数教科书<span style="color:rgb(22, 126, 251);">将李代数定义为一个具有满足所有这些性质的李括号的向量空间</span>,但应值得注意的是,这些李群是这些性质的重要根源。</p><p class="ql-block"><b>李理论图示</b></p><p class="ql-block">这引出这个被认为代表李理论的图示。</p> <p class="ql-block">这是什么呢?如果你听说过怪兽群(monster group),它们概念是相似的。对于怪兽群,我们想要考虑有限群,有限集合G,</p> <p class="ql-block">这样可以定义满足这些公理的乘法。这些有限群可以分解为不同的构建块,被称为<span style="color:rgb(22, 126, 251);">简单群</span>(simple groups)。</p> <p class="ql-block">这些简单群是有限群的原子,数学家想要对这些构建块进行分类。有许多不同的机制可以产生无穷多的简单群。以相似方式产生的构建块被归为一个<span style="color:rgb(22, 126, 251);">无穷族</span>(infinite families)。但是还有很多可能性,被称为<span style="color:rgb(22, 126, 251);">“零星”群</span>(sporadic groups)。有26或27个,取决于你是否想将其中一个(构建块)计算在那些无限族中。</p> <p class="ql-block">顺便说一句,这个构建块被称为<span style="color:rgb(22, 126, 251);">蒂茨群</span>(Tis group),以法国数学家雅克·蒂茨命名。</p> <p class="ql-block">这有点离题,因为这些零星群的明星是怪兽群,到目前为止是最大的、最复杂的零星群(这26、27个零星群中的)。这个分类与对李代数的分类类似。类似于群的定义,李代数也有一个满足某些性质的李括号。只用这些性质,我们想要对李代数的构建块进行分类。类似于群的情况,这些简单李代数有无穷的族。这不像群,恰好只有4个,分别标为A_n, B_n, C_n和D_n。除了这些无限族外,还有恰好5个被遗漏的,被称为<span style="color:rgb(22, 126, 251);">“例外”的李代数</span>,分别标为E_6、E_7、E_8、F_4和G_2。</p> <p class="ql-block"><span style="color:rgb(22, 126, 251);">E_8</span>是这五个中最复杂的,因此它在某种程度上是李代数中的怪兽群。这个特定的图片是E_8的图示描述:</p> <p class="ql-block">所以,即使想要研究李群,我们也要转而研究李代数,因为所有信息都被保留了,而且它们更容易研究。</p> <p class="ql-block"><a href="https://mp.weixin.qq.com/s/tvh1sY1ErfuE-7huK8isUw" target="_blank">此文来自《老胡说科学》</a></p>