第五章: 从表观基因组(表观遗传学)解读“衰老的本质#
在第四章中,我们介绍了被称为“长寿基因”的Sirtuin家族的存在。“遗传学开创的新世界”仍在向我们展开更广阔的探索图景。那么,这些Sirtuin基因所表达的蛋白质,在生物体内究竟承担着怎样的功能?其核心作用可以概括为“维护遗传信息的完整性”与“维持DNA的清洁度”。
听到这里,您可能会感到惊讶:难道基因和DNA也会积累“污垢”吗?
Sirtuin基因的作用是什么?#
在第一章中,我们明确了实际年龄与生物学年龄的区别,并介绍了能够反映这两者的测量方法。其中,一种能够更真实展现人体生物学年龄的检测手段——通过评估基因和DNA的"损伤程度"来测量衰老状态的方法,正在不断得到验证与发展。这种方法就是所谓的"表观遗传时钟"。
基因组承载着生命个体所有的遗传信息。而表观基因组,则是指"围绕在基因周围的调控环境",它虽然不改变DNA序列本身,却能通过化学修饰等方式影响基因的表达。这引发了一个深层次的思考:当我们谈论基因层面的衰老时,我们究竟指的是基因本身的衰老,还是基因组的衰老,抑或是表观基因组的衰老?
“表观遗传时钟"这一概念的提出暗示着我们:仅依靠第四章讨论的基因本身,或许还不足以完全解读"衰老的本质”。在本章中,我们将首先厘清基因组、染色体、DNA、基因这些基本概念,然后从它们的对应面——“表观基因组"入手,继续深入探索衰老的本质。
基因组/染色体/DNA/基因#
首先,我们来梳理相关术语。表观基因组(Epigenome)中的“epi”这一前缀意为“在…之上”,蕴含“虽非核心却与核心密切相关”的微妙含义。这一用法也常见于“episode(插曲)”、“epilogue(尾声)”等词汇中。在表观基因组的语境下,它特指“附加于基因组之上的调控信息”。要理解表观基因组,我们首先需要准确把握基因组(Genome)的概念。
在本节中,您无需对基因组、染色体、DNA、基因这些术语进行逐字死记硬背,只需理解它们整体上归属于“基因组”这一大概念,并且与后续将展开的“表观基因组”概念形成对应即可。
再次明确,基因组被定义为一个生命个体所承载的全部遗传信息的总和。我们可以做一个比喻:倘若将某位历史伟人的一生著述整理成一部23卷的文集,那么“基因组”就相当于这部文集的统称,例如《某某全集》。其中的每一卷书,就相当于一条染色体。正如23卷书籍合在一起被称为《某某大全》一样,人类的23对染色体总和也被称为基因组。DNA则如同书中记载的所有字符串,而其中承载着明确生物学功能的文字段落,才被称为“基因”。实际上,这些有功能的“基因”部分,仅占整个基因组(即全部DNA信息)的不到2%。
为了更清晰地展示其层级结构,我们再举一个现代一点的例子:如果将“某某车站周边区域整体二次开发项目的全部规划内容”比作基因组,那么该项目中新建的23栋高层塔楼,便分别对应着23对染色体。每一栋塔楼内部的所有空间结构总和,则相当于DNA。而其中作为商品房在市场上公开出售的部分(约占全部空间的比例),就对应着基因——令人惊讶的是,这部分“基因”占比竟也不到总面积的2%。

读者拿到的新建楼盘宣传册,往往融合了多个层面的信息:“某某车站周边综合开发!!”这类属于基因组层面的宏观定位;“步行X分钟直达车站”体现的是染色体层面的区位特征;“边套、朝南、两室一厅一卫”则对应基因层面的具体户型。正如商品房项目中除了住宅单元还包含商铺区域一样,DNA中也存在着大量非编码序列。
这些信息在宣传资料中相互交织,形成了层次分明的表述体系。同理,基因组、染色体、DNA、基因这些术语,在概略描述时可相互替代,但在精确讨论时则需要严格区分。希望通过这样的类比,能让读者对自然科学的表达方式产生更亲切的认知。
回到正题。基因组的构成基础是DNA分子。众所周知,DNA采用双螺旋结构,由两条核苷酸链相互缠绕形成。这种复杂结构仅由四种碱基构成:A(腺嘌呤)、C(胞嘧啶)、G(鸟嘌呤)和T(胸腺嘧啶)。这些碱基的排列顺序决定了全部遗传信息。
在双螺旋结构中,碱基配对遵循严格规则:一条链上的A必定与另一条链上的T配对,一条链上的C必定与另一条链上的G配对。而A与C、A与G、C与T、G与T之间则不能形成稳定配对。这种精确的互补配对机制,是遗传信息稳定传递的分子基础。
DNA仅由四种碱基序列构成,其中被称为“基因”的区域尤为特殊。在这些基因的上游,存在着能够对特定刺激作出响应的调控区。当该区域发生化学修饰并被激活时,下游基因区域的DNA双螺旋结构会解旋,使单链部分暴露。随后,该段DNA信息会通过类似复印的机制被读取,并生成对应的RNA分子。此过程中同样遵循严格的碱基配对规则。
若将DNA比作版画的原版或鱼拓的原始模具,那么RNA就如同从原版印制出的复制品。更重要的是,RNA比DNA具有更强的移动能力,能够从含有23对染色体的细胞核中离开,进入细胞质,抵达名为“核糖体”的细胞器。在这里,核糖体将以RNA携带的信息为模板,合成与原始DNA对应的蛋白质。这些过程在生物学上分别称为“转录”(从DNA合成RNA)和“翻译”(从RNA合成蛋白质)。
由此可见,以DNA承载的遗传信息为基础,通过生成各类蛋白质,最终构建出细胞及细胞外基质等生命结构。DNA可谓我们身体的“设计总图”。在计算机编程中,仅用0和1两个符号记录的二进制系统已令人称奇;而DNA虽不能简单称为四进制,但仅凭四种碱基的排列组合,就能决定一个生命个体的全部遗传特征,这无疑是一套精妙绝伦的生命编码机制。
在此需要特别说明:尽管我将基因描述为DNA中“具有生物学功能”的区域,但所谓“功能”具体指的是能够进行转录和翻译。简言之,我们将能够指导蛋白质合成的DNA区域称为基因。当然,DNA中也存在大量不直接参与蛋白质合成的区段,例如第二章中提到的端粒就是典型代表。
端粒位于染色体末端,由TTAGGG这一六碱基序列多次重复构成。它毫无疑问是DNA的组成部分,但并不编码任何蛋白质。对于生命体而言,端粒在保护遗传信息完整性方面扮演着不可替代的角色;然而若从“作为蛋白质合成蓝图”的角度审视,它确实不具备传统意义上的编码功能。
为地狱的看门狗套上项圈#
DNA→RNA→蛋白质这一系列过程,在传统上被称为“中心法则”。它被译为“中心教义”,被奉为绝对正确、颠扑不破的世界观。然而,世间常识总会改变。这种“医学常识”也不例外。现今已知信息会沿着与中心法则完全相反的方向——即从RNA到DNA的方向进行转录。这一机制被称为“逆转录”,辅助这一过程的酶被称为“逆转录酶”。 利用这一逆转录机制,被称为逆转录病毒(retrovirus)的这类病毒,将自身的RNA嵌入人类的DNA中。一个典型的例子是人类免疫缺陷病毒(HIV)。已知感染这种病毒会导致艾滋病的发生。 在DNA中通过逆转录能够嵌入的,并不仅限于外部的遗传信息,甚至有可能嵌入属于自身的遗传信息。

DNA中除了基因区域外,还存在着大量非编码序列。令人惊讶的是,这些序列中约有一半具有在基因组内“移动”的能力。这类能够改变自身位置的遗传元件,因其“转座”特性而被命名为“转座因子”。
转座机制主要分为两类:直接切割并移动DNA片段的DNA转座因子,以及需通过RNA中间体进行逆转录的逆转座因子。在人类基因组中,DNA转座因子虽保留了结构序列,但其转座活性已被细胞严密抑制。真正具有潜在危害的是利用逆转录酶实现移动的逆转座因子。“retro”这一前缀意为“逆向”,准确反映了其逆转录的特性。
若逆转座因子插入到具有重要功能的基因区域,将导致该段DNA无法正常进行转录和翻译,进而无法生成正确的蛋白质。研究证实,这种插入事件可引发多种疾病。有报告显示,在53%的癌症病例中均观察到逆转座因子侵入基因区域的现象。
由此可见,转座因子的存在犹如一柄悬在基因组上的达摩克利斯之剑。若其插入位置恰好在非编码区,通常不会引起严重后果;但若偶然插入关键基因区域,则可能引发疾病,甚至导致p53、rb等重要抑癌基因功能丧失。
面对这种潜在威胁,生物体进化出了相应的约束机制——即“DNA甲基化”。更准确地说,是通过对转座因子启动区域进行特异的DNA甲基化修饰,使其失去转座活性。这类对基因组施加的、不改变DNA序列本身的调控信息总和,正是我们所说的“表观基因组”。
什么是表观基因组?#
我们曾说明,表观基因组(Epigenome)中的“表观”(epi)一词,具有“虽非核心却与核心密切相关”的含义。基因组的定义是“一个生命个体所承载的全部遗传信息”,由此引申,表观基因组可理解为“相对于基因组本身而言,后天附加于其上的全部调控信息”。
简而言之,表观基因组是各类遗传信息“开关”状态的集合。如果以音乐演奏作为比喻:基因组如同固定不变的乐谱,而不同的演奏家诠释同一份乐谱时,其处理方式、情感表达和艺术呈现却千差万别——这种对乐谱的演绎方式,就相当于表观基因组所决定的基因表达状态。
基因组:乐谱本身 / 遗传信息的全部内容
表观基因组:乐谱的诠释方式 / 遗传信息的表达状态
这种遗传信息的“开关”状态,实际上是通过在DNA分子上添加特定的化学修饰来实现的。在专业术语中,这被称为DNA甲基化修饰、DNA乙酰化修饰等。正如前文所述,这类修饰能够有效抑制转座因子的活性。当然,它们也同样调控着其他基因组区域(包括基因区域)的表达状态。
由于不同基因的表达会产生不同的蛋白质,而基因又是构建细胞的蓝图,因此我们可以说:每个细胞的特性和功能差异,本质上都受到表观基因组的精密调控。事实上,我们体内的所有细胞都拥有完全相同的基因组序列。既然源自同一个体,那么细胞之间的类型和功能差异,归根结底就是由“哪些基因被启动、哪些被关闭”这种表观基因组层面的调控所决定的。
牵牛花的故事,三花猫的故事#
让我们用一个身边的例子来说明。您是否还记得小学自然课上种植牵牛花的经历?那些牵牛花千姿百态的花纹差异,实际上正是表观基因组调控的结果。
假设我们准备了两颗经过基因改良以获得美丽花纹的牵牛花种子,它们的基因组完全一致——这种关系被称为“克隆”。将其中一颗在家中栽培,另一颗在不同环境中种植,最终呈现的花纹往往大相径庭。基因组相同,但作为表现型的花纹却完全不同。这说明在基因层面之外,必然有其他因素发生了变化。没错,正是表观基因组因环境差异产生了改变。这是一个典型的环境因素影响表观基因组的实例。
再举一个三花猫的例子。当家中心爱的三花猫年老离世时,人们可能会希望“复现”那个独特的伙伴。实际上,确实有人尝试过通过克隆技术实现这个愿望。但结果表明,新生的三花猫毛色图案与原来的完全不同——那个独一无二的家人并没有真正“回来”。这说明实际的表现型不仅取决于基因组,后天附加在基因组上的信息总和——即表观基因组,也起着至关重要的塑造作用。
现在,您是否对表观基因组有了更具体的认识?如果将基因组比作一位模特,那么表观基因组就如同妆容与服饰造型。即使是同一位模特,通过不同的装扮,可以呈现摇滚风格、哥特萝莉风,或是经典优雅风等多样化的形象。
表观遗传时钟#
我们不妨做一个思想实验:假设用我20岁时的细胞制造一个克隆体,再用我80岁时的细胞制造另一个克隆体。从定义上说,克隆体拥有完全相同的基因组。由于我本人的基因组不会随年龄改变,所以这两个克隆体在基因层面应该是“相同”的。然而,作为细胞来源的20岁的我和80岁的我,两者之间却存在着天壤之别。
这种差异究竟从何而来?既然基因组完全相同,那么关键区别必然在于表观基因组。我们是否可以通过表观基因组的变化来解释衰老现象?更进一步,通过研究表观基因组——那些附着在基因上的后天调控信息的总和,我们是否能够更真实地测量出个体的生物学年龄?
这正是“表观遗传时钟”这一指标近年来备受关注的根本原因。
日常生活中基因会被“弄脏”#
若表观基因组的变化能够反映生物学年龄与衰老进程,那么究竟是什么在悄然改变着我们体内的表观基因组?答案就隐藏在我们的日常起居之中。
我们生活中接触的紫外线、烟草、酒精乃至食品添加剂,都会在不知不觉中引发DNA的化学修饰,例如甲基化(将-H结构转变为-CH₃)和乙酰化(将-H结构转变为-CH-COOH)。此外,磷酸化与泛素化等也是常见的DNA修饰方式。通俗来说,这些过程就如同在DNA链上添加了各式“化学附件”,可被理解为DNA逐渐“积累使用痕迹”的过程。
这些附着的化学基团会微妙地改变DNA局部的电荷分布,进而影响其空间结构:某些区段会因电荷作用而紧缩缠绕,另一些则变得松弛舒展——正是通过这样的机制,表观遗传调控得以实现。
Sirtuin基因的作用:“组蛋白去乙酰化”(Histone deacetylase)#
具体来说,DNA会缠绕在一种名为组蛋白的蛋白质上——这种蛋白形状如同甜点马卡龙,DNA在其上缠绕近两圈后,得以紧凑储存。多个组蛋白进一步聚集,八个一组形成核心结构,这些核心结构再层层折叠,最终形成被称为染色质的复杂构造。
当组蛋白发生乙酰化修饰时,原本如紧密缠绕线轴般的DNA便会松散展开,这一过程好比零钱包的卡扣“啪”一声被打开。
此时,那些本不应被读取的DNA区段暴露出来,被细胞误判为有效信息进行转录。基于这些错误指令,细胞将合成异常的蛋白质,进而导致由这些蛋白质构成的细胞乃至整个生命个体开始出现功能紊乱——这正是衰老在分子层面的起始。
那么,应如何清除这些积累在基因组中的后天错误信息、“污垢”与多余的化学“附件”呢?答案正在于激活我们在第四章曾提及的Sirtuin基因(长寿基因)。
Sirtuin基因最初作为酵母sir2基因的同源物被发现。在线虫与果蝇中均鉴定出同源基因,而在大鼠与人类等哺乳动物中,sirt1基因承担相应功能。sir2一词源于“沉默信息调节蛋白2”的英文首字母缩写,其功能恰如其名:在基因层面扮演“信息秩序指挥官”的角色,有效平息基因表达的混乱。
Sirtuin基因编码的蛋白质能够特异性去除组蛋白特定位置上的乙酰基团,这一过程在专业上称为“组蛋白去乙酰化”。它如同将打开的零钱包重新扣紧:此前松散的DNA会迅速重新缠绕回组蛋白,恢复其紧密的染色质结构。在此过程中,周围冗余的甲基化、乙酰化修饰也被一并清除,堪称一次高效的基因层面“大扫除”。

在日常生活中,我们的基因会不断积累各种分子"修饰标记”。尽管人体内自带清除这些标记的机制,但我们能否通过量化这种动态平衡,来准确评估基因层面的生理状态呢?这正是"表观遗传时钟"这一创新概念的核心理念。
试想,如果能够将后天附加在基因上的表观遗传信息回拨至十年前的状态,那么由这些基因指导合成的蛋白质、由蛋白质构成的细胞乃至整个生命机体,是否也能相应恢复青春活力?当我们调整饮食、睡眠、运动等生活习惯,或接受特定治疗时,表观基因组状态会发生怎样的改变?精准监测这些变化具有重大意义。
在此背景下,Sirtuin基因家族的重要性日益凸显。目前已在哺乳动物中发现7个Sirtuin基因亚型(sirt1~7)。这些基因虽具有相似的结构特征,却在细胞内扮演着不同角色:sirt1、6、7主要位于细胞核,sirt3、4、5定位于线粒体,而sirt2则活跃在细胞质中。尽管同属Sirtuin家族,它们在体内的分布与功能却各具特色。看来,关于生命衰老的奥秘,我们仍有许多未知领域有待探索。
NAD世界——两个学术领域的交汇点#
就这样,全球科学界展开了对Sirtuin基因激活、组蛋白去乙酰化促进及表观遗传时钟逆转的深入研究。在日常生活中,最具可行性的方法当属"禁食"。曾风靡一时的16小时禁食法,不仅与第六章将提及的细胞自噬机制相关,从激活Sirtuin基因的角度来看,同样具有科学依据。
不过,很多人可能会想:有没有更便捷的方法来激活Sirtuin基因呢?因此,Sirtuin激活剂的研发备受期待,其中最具代表性的就是NMN(烟酰胺单核苷酸)。
研究表明,人类在40岁后体内一种名为NAD+(烟酰胺腺嘌呤二核苷酸)的重要物质会逐渐减少。NAD+的主要功能是激活线粒体和Sirtuin基因。很自然地,人们想到通过补充NAD+来改善40岁后出现的各种身体不适。但由于NAD+化学性质不稳定,实际补充的是其前体物质NMN。
虽然NMN存在于西兰花、毛豆等食物以及母乳中,但仅靠日常饮食很难摄取足够剂量。因此,NMN作为膳食补充剂逐渐普及。2015年NHK-BS1电视台曾对此进行专题报道,可能不少读者对此已有耳闻。
世界上首个揭示NMN/NAD+与sirtuin基因内在联系的,是华盛顿大学的今井眞一郎博士团队(第四章中亦曾提及)。他们提出了“NAD+世界”这一开创性理论框架。其核心突破在于发现:基因表达调控系统(即遗传信息的开关机制)与生物体能量代谢系统这两个原本独立运行的体系,实际上通过sirtuin基因实现了功能联动。
这一发现看似简单,实则具有深远意义——它精准指出了两个不同学科领域的交汇点,为后续研究者指明了方向。
让我们深入理解“NAD+世界”理论:sirtuin基因编码的是一类依赖NAD+的脱乙酰酶。换言之,NAD+是激活sirtuin的必要条件。基于此,研究团队提出假说:各组织器官是否通过NAD+进行信息交流,并存在统一的调控中枢?事实证明正是如此——今井团队发现大脑下丘脑就扮演着这一“指挥中心”角色,同时证实内脏脂肪细胞与全身骨骼肌也在此网络中发挥重要作用。
如第四章所述,虽然在全身范围内激活sirt1仅能改善小鼠健康状态却无法延长寿命;但若特异性激活脑部sirt1,则能显著延长寿命。这一现象与“下丘脑是寿命调控中枢”的发现完全吻合。更值得注意的是,脂肪组织与骨骼肌可能通过NAD+向下丘脑传递“SIRT1已充分激活”的制动信号——这或许能解释为何全身性SIRT1激活反而未能实现延寿效果。当然,这也表明针对脂肪组织和骨骼肌的SIRT1激活治疗,本身可能已产生足够的抗衰老效益。

以上就是“NAD⁺世界”理论的核心框架。力量训练、有氧运动和禁食等干预手段,本质上都属于生物体能量代谢的调控范畴。现有研究提出,这些方式可能通过激活Sirtuin基因,进而与延缓衰老、延长寿命产生密切关联。
在哺乳动物研究中发现:全身性激活Sirtuin基因或许能有效促进健康衰老,而特异性激活下丘脑区域的Sirtuin则可能直接带来寿命的延长。今井眞一郎团队还提出了一个关键机制:Sirtuin基因的延寿效应,很可能是通过调控细胞能量工厂——线粒体的功能来实现的。值得注意的是,虽然Sirt1主要存在于细胞核内,但它同样参与受损线粒体的修复与再生过程。关于线粒体的深入探讨,我们将在下一章(第六章)展开。
单凭NAD⁺世界理论和表观遗传学的研究,要完全揭示“衰老的本质”仍面临诸多挑战。然而,越是深入探索,越能发现更多待解的奥秘——这或许正是科学探索最迷人的特质。