科研星球

冯小琦课题组发现新的真核生物DNA甲基化修饰

作为表观遗传学修饰的重要成员,DNA甲基化广泛存在于原核生物和真核生物并发挥重要的调控作用。原核生物中,胞嘧啶(Cytosine, C)的第四位氮元素可以被甲基化修饰形成N4-甲基胞嘧啶(4mC),第五位的碳元素可以被甲基化修饰形成C5-甲基胞嘧啶(5mC)。不同于原核生物,迄今为止,真核生物中没有发现4mC,而5mC则普遍存在于真核生物的众多物种。


在真核生物中,DNA甲基转移酶DNMT1和DNMT3负责5mC的甲基化过程,并且在各物种中高度保守。在不同物种中,基因组范围内的5mC分布可以是遍在的也可能是有一定的选择性的。在脊椎动物中,全基因组范围内,只有CG (还有CHG和CHH两种含有胞嘧啶的碱基组成,H代表A或C或T)能被甲基化成5mCG,例如人体组织中有超过80%的CG都被甲基化为5mCG。而在开花植物中,5mC却只发生在转座子区(Transposon Elements, TE)和一少部分基因上,但却不只存在于CG,还涵盖CHG和CHH。在动植物的发育过程中,5mC的水平在很大程度上保持稳定,一旦紊乱会造成严重的发育异常和疾病,例如癌症。但值得注意的是,在哺乳动物和开花植物的雄性生殖细胞—精子的发育的过程中,5mC则会发生重编程(reprogramming)。这种5mC重编程对于精子发育至关重要。


近日,来自John Innes Centre的冯小琦课题组在预印本bioRxiv上post了题为Extensive N4 Cytosine Methylation is Essential for Marchantia Sperm Function文章,文章首次发现了4mC在真核生物基因组中的存在并详实的证明了4mC参与调控精子发育和功能。

下载.jpeg

具体来说,作者发现4mC产生并存在于陆地植物地钱Marchantia Polymorpha的精子发育过程,由两个前所未知的甲基转移酶修饰。作者将这两个真核生物中首次发现的4mC甲基转移酶命名为Marchantia polymorpha DNA N4 CYTOSINE METHYLTRANSFERASE1a(MpDN4MT1a和MpDN4MT1b)。有趣的是,作者发现整个精子发育过程存在两种DNA甲基化的重编程(DNA methylation reprogramming): 一种是CHG和CHH(non-CG)的5mC甲基化从早期只存在于转座子区到全基因组范围的扩张,和转座子区的5mCG甲基化程度的加强,这个5mC的重编程过程由MpCMTa和MpDNMT3b甲基转移酶参与调控;另一种是始于精子成熟期的,特异发生于基因区(genic region)的4mCG,这个4mC的重编程过程是由新发现的两个在精子发育后期特异表达的甲基转移酶MpDN4MT1a和MpDN4MT1b介导的。


作者发现,全基因组范围内,相较于营养组织的低DNA甲基化水平(17%),成熟的精子具有近乎全基因组覆盖的DNA甲基化程度(97%)。为了研究这一巨大的DNA甲基化变化过程和机理,作者分离了不同发育时期的精子前体细胞群,以进行转录组、甲基组和发育时期的同步分析。如下图所示:

下载 (1).jpeg

结果显示,在精子发育过程中,除转座子区外的基因组范围内,有两波(two waves)不同的DNA甲基化修饰的发生,第一波发生在non-CG上,而后第二波发生在CG上。这种全基因组的DNA甲基化修饰与精子的成熟过程高度相关,并且这种现象并不存在于受精后的胚胎。如下图所示:

下载 (2).jpeg

结合转录组和遗传学分析,作者发现了两个5mC甲基转移酶(MpDNMT3b和MpCMTa)在精子发育过程中表达量升高,并进而确认了他们参与调控发生在non-CG的5mC甲基化的重编程(first wave,第一波),但不负责发生在CG上的重编程(second wave,第二波)。如下图所示:

下载 (3).jpeg

虽然没有任何5mC甲基转移酶的表达和第二波重编程相关,但令人兴奋的是,作者发现了两个全新的甲基转移酶MpDN4MT1s。MpDN4MTs不与5mC甲基转移酶同源,但和原核生物的4mC甲基转移酶高度同源。他们在精子发育后期特异表达,暗示他们可能负责第二波发生在CG上的DNA甲基化重编程。如下图所示:

下载 (4).jpeg

因为经典的检测DNA甲基化程度的重亚硫酸盐测序(Bisulfite Sequencing,BS-seq)不能区别4mC和5mC,所以作者通过液相质谱(LC-MS),单分子实时测序(Pacbio SMRT-seq)和遗传学方法,检测并证实了,第二波发生在CG上的甲基化实则是4mC甲基化,是由MpDN4MT1s介导产生的,并且这种4mC甲基化覆盖了精子基因组范围内超过50%的CG。这是首次发现4mC存在于真核生物的强有力的证据。如下图所示:

下载 (5).jpeg

值得注意的是,SMRT-seq检测到精子基因组的转座子区有低水平的甲基化。这些信号可能是转座子区覆盖的5mC 1)抑制了进一步4mC的修饰,并且本身造成了SMRT-seq的杂信号,2)实际上被修饰成为了4,5mC,但SMRT-seq不具备检测4,5mC的能力。通过LC-MS实验,作者排除了第二种可能性,因为LC-MS实验并没有在精子中检测到4,5mC。如下图所示:

640.png

作者最终通过CRISPR基因敲除技术敲除了MpDN4MT1s,发现突变体精子的转录组有很大程度的紊乱,并且精子游动异常,表现为更强的不定向性和减慢的游动速度。如下图所示:

640 (2).png

综上所述,作者首次揭示了4mC存在于真核生物中并参与雄性生殖发育,并发现了首个真核生物的4mC DNA甲基转移酶。这项工作开启了表观生物学的新篇章,引领了真核生物中4mC的研究。通过此项研究作者还揭示了地钱精子发育过程的两波DNA甲基化重编程过程。这两波DNA甲基化重编程最终形成了特有的全基因组(覆盖率97%)甲基化模式,其中基因和转座子分别由4mC和5mC标记,展示了两种甲基化修饰的互作和对基因组分区的功能 (如下图所示)

640 (1).png

原文链接:
https://doi.org/10.1101/2021.02.12.428880


没有账号?