参考资料: 1.医学分子生物学 第六章 第一节 表观遗传学-甲基化 2.医学分子生物学 第六章 第二节 表观遗传学-组蛋白修饰 3.组蛋白修饰是个啥
1.什么是表观遗传学?
举个例子:同卵双生的双胞胎个体,从遗传学角度说他们的DNA序列是一致的,但多种表型存在一些差异。经典的孟德尔遗传定律和生物学表型之间还存在另外一层调控因素,即表观遗传。
表观遗传(Epigenetics)是指DNA序列未发生变化,但基因表达却发生了可遗传改变。
这种改变的特点:可遗传性;可逆性;没有DNA序列的变化。
可逆性:表观遗传的修饰方式可以在某些因素的条件下被去除。这使得通过调控表观遗传来影响生物学性状称为可能。
表观遗传改变主要从四个层面调控基因表达
(1)DNA甲基化:DNA共价结合甲基基团,使相同序列等位基因处于不同修饰状态;
(2)组蛋白修饰:通过对结合DNA的组蛋白进行不同的化学修饰实现对基因表达的调控;
(3)染色质重塑:通过改变染色质的空间构象实现对基因表达的调控;
(4)非编码RNA的调控:RNA可通过某些机制实现对基因转录和转录后的调控。
2.DNA甲基化
DNA序列上特定的碱基在DNA甲基转移酶(DNMT)的催化作用下,以S-腺苷甲硫氨酸(SAM)作为甲基供体,通过共价结合的方式获得一个甲基基团的化学修饰过程。
最常见能够被甲基化的碱基是胞嘧啶(C),此外腺嘌呤,鸟嘌呤也可以被甲基化。
下图是5甲基胞嘧啶。在4位上是一个胺基,5位上没有其他基团的结合。在SAM提供甲基的情况下,在DNMT(DNA甲基转移酶)的作用下,甲基从SAM转移到胞嘧啶的5位,成为了5甲基胞嘧啶。
DNA甲基转移酶
根据序列的同源性和功能,真核生物DNA甲基化转移酶主要分为:Dnmt 1, Dnmt2 和Dnmt 3.Dnmt 1参与序列甲基化的维持; Dnmt 3主要作用是从头甲基化。
a图左边的序列通过Dnmt 3的作用转化为右边的序列,这两个序列的差别是,所有的C(互补链上)被甲基化,这是一种重头甲基化的方式。
b图中左边的序列其中一条链上C位点被甲基化,互补链上的C没有甲基化,可以在甲基化维持酶(Dnmt 1)的作用下可以使得另外一条非甲基化的链进行甲基化。
DNA去甲基酶
5-甲基胞嘧啶(5mC)可在两个位点进行化学修饰:胺基和甲基。主动去甲基过程可以通过AID/APOBEC, Tet, TUG/SMUG1辅助以脱去甲基称为胞嘧啶。
DNA序列C位点的甲基化是可逆的,既可以在甲基化酶的作用下发生甲基化,又可以在去甲基化酶的作用下发生去甲基化。
CpG甲基化
C位点的甲基化主要发生在CpG序列上。
CpG二核苷酸中的C常常被甲基化。在哺乳动物中CpG以两种形式存在:一种是分散于DNA序列;另一种呈现高度聚集,为CpG岛。在正常组织里,70%~90%分散的CpG是被甲基修饰(对维持基因族的稳定性具有重要作用),而位于基因转录调控区域CpG岛中的CpG则往往是非甲基化的(有利于转录因子和转录调控区域结合,影响下游结构基因的转录)。
CpG岛常常位于基因启动子区域
以下面这个基因为例,红色竖线代表CpG位点,下面是APRT这个基因的第一外显子和第二外显子,可以看到CpG位点集中于启动子区域,第一外显子和第一内含子区域。
启动子区域CpG位点甲基化影响基因转录
以下图为例,黄色部分是CpG位点中的C位点,当其为非甲基化时,转录因子和辅助转录蛋白可以顺利地结合在转录的其实区域,从而推动下游基因的转录。
然而,当C被甲基化之后,空间结构发生了变化,转录因子和辅助转录蛋白不能结合在转录其实区域,最终造成基因转录的抑制。
因此,甲基化常常通过基因的转录来调控基因的表达。
肿瘤细胞中CpG位点甲基化变化
以肿瘤细胞中CpG位点甲基化变化为例,上一张图是正常细胞,左边是肿瘤抑制基因,右边是分散的CpG位点,在正常细胞的肿瘤抑制基因中,CpG位点通常是非甲基化的,因此这些基因是可以表达的。在分散的CpG位点当中常常是甲基化的。
在下方的肿瘤细胞当中,肿瘤抑制基因CpG位点中的C常常是甲基化的,造成该基因表达沉默,但分散CpG位点中的C常常是非甲基化的。
因此,这样造成抑癌基因表达缺失,同时造成整个基因组的不稳定。
DNA甲基化检测方法
(1)亚硫酸氢钠——测序法
(2)亚硫酸氢钠——酶切法
(3)甲基化特异性PCR(MSP)
(4) 亚硫酸氢钠-DHPLC
通常要经过亚硫酸氢钠的修饰,亚硫酸氢钠能够将甲基化的序列差异转化为DNA一级结构的序列差异。
下图中CpG结构中的C是甲基化的,左边的C是非甲基化的,在亚硫酸氢盐的作用下,甲基化的C仍然能够保留甲基化的状态,仍然为C,非甲基化的C在亚硫酸氢盐的作用以后,转化为U,在之后的PCR过程中转化为T。
3.组蛋白修饰
真核生物染色体的组装
真核生物染色体主要由DNA和蛋白质构成,蛋白质包括组蛋白和非组蛋白。染色体的基本单位是核小体(nucleosome)。和DNA结合的是组蛋白成分。
核小体
核小体的组成包括核心区域和连接区域。核心区域为146bp的DNA缠绕在组蛋白八聚体上形成;连接区域为60bp的DNA与组蛋白H1构成。
组蛋白八聚体
核小体核心区域的组蛋白八聚体包括H2A,H2B,H3和H4各二聚体;其序列保守且N末端游离在外,可以被不同的蛋白结合或作为酶作用的底物位点。
形成核小体核心区域的H2A,H2B,H3和H4这些组蛋白,在N(胺基)末端存在大量的可以被修饰的氨基酸,这些氨基酸主要以赖氨酸(K)以及精氨酸(R)为主,也包括丝氨酸和苏氨酸,这些氨基酸存在不同的残基,在这些残基上可以被不同的共价修饰,例如乙酰化修饰,甲基化修饰,磷酸化修饰,赖氨酸K既可以被乙酰化也可以被甲基化,R类似,丝氨酸和苏氨酸常常被磷酸化。
“核小体”是染色体的基本结构单位。4种组蛋白,各2个组成一个8聚体,DNA链再缠绕上去,就形成核小体了。每个组蛋白肽链都有氮端和碳端两个“尾巴”,这些“尾巴”上的氨基酸可以被加上一些化学基团,即“修饰”。
组蛋白修饰
组蛋白修饰(histone modification)是指组蛋白在相关酶的作用下发生甲基化,乙酰化,磷酸化,腺苷酸化,泛素化,ADP核糖基化等修饰的过程。
组蛋白修饰酶包括组蛋白乙酰化酶(HAT),去乙酰化酶(HDAC),甲基转移酶,去甲基化酶等。
组蛋白修饰的作用
组蛋白的修饰可通过影响组蛋白与DNA双链的亲和性,从而改变核小体结构以及染色质的疏松或凝集状态,或通过影响其他转录因子与结构基因启动子的亲和性来发挥基因表达调控作用。
组蛋白修饰影响核小体结构
下图展示核小体组装的两个不同的结构,左边呈凝聚状态,与核小体结合的DNA区域很难与转录因子结合,这样一段区域中的基因片段很难表达;右边区域比较分散,与核小体结合的DNA区域更容易与转录因子结合,该区域呈现DNA转录活性状态。这两种状态可以相互转化,转化的一种调控因素就是组蛋白修饰,通过核心区域的氨基末端的氨基酸被不同的共价基团修饰以后,这两种状态可以发生转化。
因此组蛋白修饰可以通过影响核小体的空间结构来影响基因的表达。
组蛋白修饰影响染色质的空间结构
常染色质转录活性比较高,异染色质的转录活性比较低,组蛋白修饰可以通过影响核小体的结构最终来影响染色质的空间结构,从而影响基因的表达活性。
组蛋白修饰影响基因表达
组蛋白修饰不能单独发生作用。组蛋白修饰常常和DNA甲基化共同发生作用。
从图中可以看出,上方的DNA序列正在被RNA聚合酶转录,核小体相对来说比较分散。DNA序列中的C位点常常是非甲基化的。在DNA甲基化转移酶以及组蛋白去乙酰酶的作用下,DNA发生甲基化,同时组蛋白发生了去乙酰化,这是核小体结构变得比较拥挤,使得基因片段很难被转录,所以基因表达沉默。
因此组蛋白修饰常常通过与DNA甲基化相互作用共同影响基因表达。
组蛋白修饰的检测方法
(1)染色质免疫共沉淀(ChIP)
(2)染色质免疫共沉淀结合Real-time
(3)染色质免疫共沉淀结合芯片(ChIP on chip)
(4)染色质免疫共沉淀结合测序(ChIP Seq)
ChIP方法示意图:
以某个转录因子是否与DNA序列结合为例。首先对细胞和组织样品进行固定,在固定过程中,使得转录因子和集合的DNA序列进行胶粘,使得在后续操作过程中不会解离,之后通过超声方式或者酶解的方式将DNA片段和转录因子之间的复合物进行片段化,之后用转录因子相关的抗体进行免疫沉淀。在免疫沉淀过程中,抗体会识别转录因子,而转录因子又被胶粘在结合的DNA序列上。最后,免疫沉淀下来的复合物既包括相应的抗体,也包括要检测的转录因子以及转录因子结合的DNA序列。得到复合体之后,再通过解胶粘的方式,获得与转录因子所结合的DNA片段,可以对DNA片段设计引物,进行PCR扩增,或者结合芯片或二代测序计数来了解转录因子和哪一个核算片段结合,以及结合的量。