表观遗传学的修饰与染色质重塑(2)
时间:2017-04-05 来源:未知 作者:chunt 本文字数:16250字
1.2 Cp G结合蛋白质与DNA甲基化的调控
除组蛋白修饰外, DNA甲基化(m5C或m C)也参与调控基因转录,主要表现为抑制基因表达[37].绝大部分DNA甲基化发生在胞嘧啶-鸟嘌呤(Cp G)双核苷的胞嘧啶上。已知CXXC[38]和MBD[37]结构域分别结合非修饰和甲基化的Cp G. CXXC为40~60个氨基酸长的锌指结构域,因含有两个CXXCXXC序列而得名[39].人有十余种含CXXC结构域的蛋白质,多是表观遗传学调控相关的酶[39].我们在2010年解析了CFP1的CXXC结构域与Cp G双链DNA的晶体结构,发现CFP1的CXXC结构域利用含有正电的表面接触带负电的DNA的磷酸主链[40]. CXXC结构域与Cp G碱基对形成多个主链氢键,由此揭示了CXXC结构域特异识别Cp G双链DNA的结构机理(图4A)[40].CFP1通过CXXC结合Cp G DNA后,抑制该区域的Cp G甲基化,并募集SETD1A复合物,产生H3K4甲基化,从而激活基因转录[41].
我们发现CXXC家族成员尽管其结构相似,DNA结合特性却不尽相同。例如CFP1的CXXC偏好Cp GG三核苷序列,有更强的序列选择性[40].还解析了爪蟾Tet3 CXXC结构域与不同双链DNA的复合物结构。 Tet3催化甲基化胞嘧啶(m C)羟甲基化,从而导致DNA去甲基化[42].我们发现Tet3的CXXC具有更广泛的DNA结合能力,不仅结合非修饰Cp G,还可以借助一个非修饰的胞嘧啶(C)(Cp A, Cp T或Cp C)结合甲基化Cp G(m Cp G)(图4B)[42].由此构建了Tet3的CXXC与其酶活结构域协同作用的模型: Tet3通过CXXC结合C,从而募集在富含m Cp G的区域,如靶基因的上游, Tet3启动该区域m Cp G的去甲基化,使得原来被抑制的基因被激活表达[42].胞内实验表明,Tet3 CXXC结构域缺陷将导致爪蟾胚胎发育早期神经无法正常形成,更严重导致眼睛缺失[42].
1.3 RNA甲基化: RNA甲基化识别与去甲基化的机制
RNA中存在上百种修饰,其中很多RNA修饰的功能被不断揭示出来[43]. N6-甲基化腺苷(m6A)作为真核m RNA最丰富的内部修饰,通过参与调控m RNA的剪切、定位、转运、稳定性及翻译等功能,在后转录层面参与真核基因表达调控[44]. m6A在体内受到3种效应蛋白的调控,书写器(writer)、橡皮擦(eraser)和阅读器(reader)[44]. m6A甲基化转移酶是METTL3-METTL14复合物[45~47]; m6A去甲基化酶有2个: FTO[48]和ALKBH5[49],它们同属于Alkb双氧化酶家族; m6A阅读器是YTH结构域[50,51].
不同的研究组先后发现YTH结构域结合m6ARNA[45,50],但是其作用机制未知。包括本实验室在内的研究组解析了多个YTH结构域与RNA的复合物结构[52~54],发现YTH结构域用带正电荷的表面结合RNA, m6A则插入YTH结构域的一个含有芳香环和疏水氨基酸的口袋中[52]. m6A的甲基和芳环的pi电子以及疏水氨基酸侧链之间的相互作用构成了m6A特异性识别的分子基基础(图4C)[52].又解析了其他人和酵母的YTH复合物结构,揭示了这一m6A识别模式不但在人中,而且在真核生物中都是保守的[55].
作为RNA去甲基化酶, ALKBH5特异催化单链m6A RNA[56].通过解析ALKBH5和a-酮戊二酸(2OG)以及锰的复合物结构,揭示了ALKBH5结合2OG和锰的位点,并发现其内部的一个二硫键使得ALKBH5仅能识别单链,而非双链RNA[57].此外,还通过模型,找到了ALKBH5中的两个底物结合残基,并发现突变两个中任何一个,都会导致酶活丧失[57].更进一步地,解析了ALKBH5和柠檬酸的复合物,发现柠檬酸占据了ALKBH5的2OG结合位点,所以是ALKBH5的天然抑制剂(图4D)[57].这些复合物结构为将来设计ALKBH5的小分子抑制剂提供了方向和分子基础。
2染色质重塑
2.1染色质重塑复合物
ATP依赖的染色质重塑复合物SWI2/SNF2超家族[58],其 成 员 包 括SWI/SNF(switch/sucrose nonfer-mentable), CHD(chromodomain helicase DNA-binding),ISWI(imitation switch)以及INO80 (inositol- requiring80)四类(图5)。大量研究表明,染色质重塑复合物参与细胞核内包括基因表达调控、DNA复制及染色质重塑等众多生物学过程,但是至今,对其催化核小体重塑的分子机制的认识还非常模糊[59~61].
2.2 SWI/SNF家族染色质重塑复合物
SWI/SNF家族的染色质重塑复合体是最重要的一类ATP依赖性的染色质重塑复合体,主要包括SWI/SNF和RSC复合体。 SWI/SNF复合体可以通过改变核小体的位置和密度来影响DNA结合蛋白接触结合DNA的位点,通过识别核小体组蛋白的尾部修饰或者其他DNA结合蛋白,导向特定的核小体,通过水解ATP可以通过以下多种途径改变核小体的结构(改变核小体结合DNA位置,驱逐组蛋白八聚体,展开部分DNA片段或者驱逐部分组蛋白二聚体),从而暴露额外的DNA结合位点。 DNA依赖性的ATPase活性的亚基Swi2/Snf2负责水解ATP并且转移DNA的位置是SWI/SNF复合体的催化核心。 Arp7和Arp9是 肌 动 蛋 白 相 关 的 蛋 白 质 亚 基,同 时 存 在 于SWI/SNF和RSC复合体中[62].其中Swi2/Arp7/Arp9可以成稳定具有大多SWI/SNF生物学功能的核心亚复合体[63]. Snf5, Swi1, Snf6及Swi3负责与转录因子相互作用负责体内招募SWI/SNF复合体[64,65]. Swp29/Taf14亚基不仅存在于SWI/SNF复合体,而且是基本转录因子TFIIF和TFIID复合体的组成亚基。
大量的遗传和生化研究表明, SWI/SNF复合体在基因表达调控,细胞周期发展, DNA复制、重组和修复都发挥重要作用[62,66].哺乳类动物的SWI/SNF复合体在胚胎干细胞分化过程中,发生组成上的显着变化,暗示SWI/SNF复合体在胚胎干细胞分化过程中发挥作用[66].此外,近年来的研究表明, SWI/SNF复合体多个亚基的突变与多种癌症直接相关[67~69](~20%的癌症对应多个SWI/SNF亚基的突变,尤其是SMARCA4/BRG1(Snf2), ARID1A/BAF250a(SWI1)和SMARCB1/INI1(SNF5)等)。
阐明各个亚基特定的生物学功能及其与核小体之间的相互作用是阐明SWI/SNF复合体改变调控染色质结构的分子机制所必须的,然而目前为止,对SWI/SNF各个亚基的特定的生物学功能的认识还非常有限。 SWI/SNF家族复合体在体内的表达量非常低,组成庞大复杂(十几个亚基组成,分子量>1 MDa)而 且 还 存 在 动 态 的 亚 基 组 成 和 构 象 多 样 性;给SWI/SNF复合体的纯化和结构研究带来巨大挑战[70].我们克服了重重困难,已解析了Swi/Snf复合体纳米分辨率的冷冻电子显微镜结构及其重塑核小体的多种中间状态的三维结构,阐明了Swi/Snf的功能模块和亚基组成,为全面阐释Swi/Snf复合体重塑染色质的分子机制打下了坚实基础(未发表资料)。
2.3 INO80家族染色质重塑复合物
INO80和SWR1复合体同属于INO80家族成员,都是十几个亚基的蛋白质复合物,具有非常相似的亚基组成和高度保守的结构域[71,72].二者的催化亚基Ino80和Swr1在其ATPase结构域都存在一个长的插入,用于招募共用的Rvb1/2解旋酶;在其N端都存在HSA结构域(helicase SANT-associated domain),用于招募和结合肌动蛋白(actin)和肌动相关蛋白(actin-related proteins, Arp);两个复合体还共享了多个亚基,包括Rv B1, Rv B2, actin, Arp4等。 INO80和SWR1复合体高度保守的结构域、共用的多个亚基;暗示着二者的结构应该高度相似。出乎意料的是,近期在同期Cell杂志上发表的解析INO80和SWR1复合体的电子显微镜结构却差异显着[73,74].最显着的不同有以下三个方面: SWR1的构象非常紧致,仅包含单层6元杂环的Rv B模块, Arp4-actin靠近Rv B1;而INO80的结构非常松散,包含双层12元杂环的Rv B模块, Arp8-Arp4-actin远离Rv B1.
限于Ino80显着的结构柔性给三维重构带来的严峻挑战,已发表的Ino80结构信息采用了化学交联进行了稳定,并在冷冻制样时加入了重金属染液以提高衬度;所解析的结构不仅存在过度交联对构象的显着影响,而且重金属染液也不可避免地干扰构象和稳定性。系统优化了INO80和SWR1的生化制备条件(尤其是轻度交联的条件),将其完全包裹在玻璃状态的冰中进行冷冻制样。已重构真正意义上的cryo-EM结构与已报道的cryo-负染的结构相比,不仅分辨率明显提高,而且总体结构也显着不同。此外,通过亚基缺失获得INO80和SWR1的一系列亚复合物的三维结构,这些亚复合物结构的细致比较,有望获得INO80和SWR1各个亚基的清晰定位;将结构的信息与各个亚基的功能信息联系起来,揭示INO80和SWR1复合体的模块架构及各个亚基的相互作用关系。
中国科学技术大学蔡刚实验室瞄准染色质重塑这一重大基本生物学问题,专注利用冷冻电子显微镜解析染色质重塑复合体及其与核小体的高分辨率冷冻电子显微镜结构;期望从功能和结构上阐明染色质结构和基因组稳定性调控的分子机制,尤其是解析SWI/SNF, INO80和SWR1复合体及其与核小体复合物的高分辨率冷冻电子显微镜结构,清晰定位各个复合体重要亚基和模块,阐明这三种复合体重塑核小体的分子机制。
3植物的表观遗传学
与动物相似,植物组蛋白H3也存在保守的第四位赖氨酸甲基化,参与基因的转录激活功能。在酵母中, SET1是 唯 的 一 个 多 梳 家 族 蛋 白 质,参 与COMPASS复合体的形成,具有使组蛋白H3K4一、二、三甲基化的功能。而在拟南芥中, SET1演化成5个蛋白,分别为ATX1, ATX2, ATX3, ATX4及ATX5(图6A)。 ATX1与ATX2具有高度的同源性,二者都含有PWWP, DAST, e PHD及SET结构域, ATX1具有H3K4三甲基的功能,而ATX2具有H3K4二甲基功能[75].功能缺失的atx1具有开花提前、影响花器官的形成、降低干旱响应的表型[76~79], atx2的功能缺失没有任何的表型[76].
大规模转录组和组蛋白修饰的研究显示,植物组蛋白H3K4me3与基因的转录水平呈正相关[80,81].与动物不同,植物中不存在可能直接结合H3K4me3的TFIID蛋白,且ATX1的e PHD结构域与PHD不同,不具有结合H3K4me3的功能,表明植物中组蛋白H3K4me3修饰,不能形成一个正反馈调节转录的过程,可能存在不同于动物细胞中的机制。 ATX1在启动子区和编码区,有着两种不同的功能,在启动子区参与转录起始复合体的形成,调控转录的开始;在编码区,受到PolⅡ的招募,完成甲基化H3K4的功能(图6B)[77].如果在不破坏启动子区的转录起始复合体,在只改变ATX1的甲基转移酶活性情况下, H3K4me3则具有转录延伸的调控作用[82,83]. H3K4me3对基因的转录正调控,不仅体现在生长发育基因表达水平的调控,而且还体现在对环境诱导基因的调节,并且能在较长时间发挥功能。将干旱处理的拟南芥,恢复后,受干旱诱导的RD29B, RAB18等基因的表达水平恢复至本底水平,但H3K4me3的水平依然与诱导水平一致。如果再次干旱诱导, RD29B, RAB18基因的表达水平,即表现出比第一次诱导高出数倍的水平,这种现象在玉米中同样存在。 RD29B, RAB18这类基因,称为有“干旱记忆”功能的基因, H3K4me3是这类“干旱记忆”基因上的重要标志[82,84,85].
拟南芥中ATX1是植物中唯一研究较为清楚的TRITHORAX蛋白,但报道其直接调控的基因仅为为数不多的几个,如FLC, LTP3, NCED3, WRKY7,A P 1等[ 7 6 ~ 7 8 , 8 6 , 8 7 ].与M L L 1不同,拟南芥中的TRITHORAX蛋白不具有CXXC结构域(图6C),因此ATX1如何作用于目标基因并不清楚。 ATX1可能与一些转录因子相互作用,由转录因子直接结合与目标基因,完成H3K4me3的功能。 ATX1中含有PWWP结构域,动物细胞中的PWWP结构域,具有结合DNA及组蛋白H3K36m3的功能。因此, ATX1也可能直接结合目标基因,从而完成甲基化修饰。此外,植物的H3K4me3主要集中在转录起始后300 bp区,在启动子区分布较少,形成的原因依然不清楚[78,80].组蛋白H3K4me3不仅参与转录的调节,同样也受转录延伸的调控。在动物细胞中, CDK9能够特异地磷酸化转录延伸因子SPT5的保守苏氨酸位点,而磷酸化苏氨酸的SPT5能够与COMPASS-like复合体中的亚基RTF1相互作用[88].在酵母中, BUR2是CDK9的同源蛋白,能够磷酸化SPT5上保守的丝氨酸和苏氨酸,虽然丝氨酸和苏氨酸的磷酸化与COMPASS之间相互作用还未知,但功能缺失性的BUR2和SPT5能够降低H3K4me3和H3K36me3的修饰,表明转录延伸因子不仅参与转录调控,同时也参与H3K4me3的组蛋白修饰[89].在拟南芥中, SPT5存在2个拷贝,是否有类似的功能还有待阐述。在生长发育和对环境适应的过程中,植物有着自身的独特性,通过对植物表观修饰的研究,将有助于对表观遗传学的全面认识和理解。
相近分类: