众生平等

足迹

<p class="ql-block">大千世界,花鸟鱼虫、飞禽走兽,欣欣向荣;花开花落、进化演化、生老病死。佛祖说,众生平等。那众生是什么?按照现代生物学来说,众生就是一切生命,即所有动植物和微生物。那为什么平等?因为大家都来自一个源头——生命的基础代码。</p> <p class="ql-block">这代码,就是碱基。</p><p class="ql-block">在DNA序列中,指A、T、C、G四种(即腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤);在mRNA(称为“信使”,负责把DNA中储存的遗传指令传递给蛋白质合成工厂)序列中,指A、U、C、G四种(尿嘧啶U替代了T)。</p><p class="ql-block">它们既是物质(生物学中称为碱基,化学视角下是分子),又是信息的载体。我们今天只讨论科学已证实的层面,至于比碱基分子更微观的原子及量子层面,以后再探讨。</p> <p class="ql-block">从碱基说起。碱基是核苷酸的组成部分,这里不细说。重要的是,DNA编码区上连续三个碱基构成一个信息存储单元(三联体序列)。到了mRNA转录时,mRNA通过碱基互补配对(A配U,C配G)从DNA的三联体序列中转录遗传信息,形成对应的三个相联碱基一组,称为密码子。比如DNA三联体序列为AAG,转录为mRNA密码子则是UUC。密码子承载着合成氨基酸的信息——例如UUC指令合成苯丙氨酸。4个碱基的排列组合理论上可产生64种密码子,不过由于存在简并性(多种密码子对应同一种氨基酸),比如UUU和UUC都对应苯丙氨酸,GAA和GAG都对应谷氨酸。64种密码子中,除3种不编码氨基酸的终止密码子外,其余61种对应20种氨基酸。蛋白质是由一串氨基酸(比如600个)连接形成的肽链,经折叠后形成的功能分子,其氨基酸序列就来源于mRNA上特定顺序排列的密码子片段。这些密码子的模板来自DNA上的某一段基因,这个过程称为转录,有点像水中的倒影。人类基因组包含约2万个蛋白质编码基因,但由于可变剪接和翻译后修饰,实际功能蛋白质种类远超此数。</p> <p class="ql-block">可以说,密码子发挥两大关键作用:一是单个密码子决定合成哪种氨基酸;二是一串密码子的排列顺序决定氨基酸的连接顺序,让氨基酸形成肽链,多条肽链再折叠成蛋白质。也就是说,基因凭借密码子的指令信息与排列顺序,决定了氨基酸序列与蛋白质结构。接着,蛋白质参与构建细胞,细胞进一步组装成各个器官,各器官协同运作,支撑起生命体的各项活动——这便是生命的逻辑。</p> <p class="ql-block">我们以《易经》八卦来比喻。易经的基础单元为爻,分为阳爻和阴爻(“⚊”和“--”),类似代表生命基础代码的4种碱基(A、T、C、G)。三爻一组构成八卦(如乾卦“☰”、坤卦“☷”),两个卦上下组合形成64卦(如屯卦“䷂”、蒙卦“䷃”);就像4种碱基每3个为一组构成64个密码子。</p><p class="ql-block">二者都以有限元素通过排列组合衍生出复杂变化:不同卦象象征万物的状态与趋势,不同密码子则对应精确的生化指令(编码氨基酸)。易有太极,是生两仪,两仪生四象,四象生八卦,八卦定吉凶,吉凶生大业。</p> <p class="ql-block">人体含有23对(46条)染色体,每条染色体的核心成分是DNA。基因是DNA上具有遗传效应的碱基序列片段,不仅包含能转录为mRNA密码子的编码区(由三联体序列组成),还包括启动子、终止子、内含子等非编码序列(非编码区)。这些非编码序列虽不直接编码蛋白质,但对基因表达至关重要——负责调控基因何时、何地开始表达,既存在于基因内部编码区之间(内含子),也存在于基因之间。人类DNA的编码区仅占碱基总数的1%~2%,而非编码区占绝大多数。</p> <p class="ql-block">DNA的双螺旋结构和碱基互补配对原则是1953年由美国的沃森和英国的克里克提出的,明确了碱基序列是遗传信息的载体。1954年,美籍俄裔物理学家伽莫夫推测密码子由三联碱基组成,为遗传密码的破译提供了方向。1961-1967年,美国人尼伦伯格、科拉纳等破译了全部64种遗传密码,证实了三联碱基编码氨基酸的机制。20世纪中后期,随着分子生物学发展,明确了基因编码区的功能是为蛋白质合成提供模板,决定氨基酸序列。随着2003年人类基因组计划完成对人类基因组约30亿个碱基的测序,基因组学研究进入了新阶段。</p> <p class="ql-block">如今,基因检测技术已成熟并广泛应用,但仍有大量蛋白质结构未明确,还有大量非编码区的未知功能待探索。下次我们将聊聊AI技术在蛋白质结构预测和非编码区功能解析上的最新突破,我们可能会觉得生命的一切好像都是代码和数字。</p>