10月31 【成功案例】通过全基因组Bisulfite测序技术研究羊卵巢DNA甲基化与生产力之间的关系
通过全基因组Bisulfite测序技术研究羊卵巢DNA甲基化与生产力之间的关系 杂志:BMC Genomics 影响因子:3.729 PMID:28969601 背景 DNA甲基化是一种表观遗传学的调控机制,在生物学调控过程中起着重要的作用,比如基因表达、基因印记、细胞分化和胚胎发生以及决定生物的表型和可塑性。甲基化发生在胞嘧啶残基的CpG核苷酸上。目前,哺乳动物中,通过高通量测序进行全基因组甲基化探索重要的生物学功能的技术被广泛应用。对农户而言,羊的生产效率以及产仔次数是重要的经济回报指标。通常情况下,生殖性状的遗传性在中等及以下,并且对表型选择的效果并不显著。因此,研究生殖能力相关的基因信息可以提高选择效率。繁殖能力由卵巢滤泡调控,该过程被精确的增殖和分化事件调控。近期的研究主要集中在DNA甲基化如何调控卵巢的形成和生殖系统发育上。一些证据表明,卵巢的发育受DNA甲基化的调控。通过对猪的卵巢甲基化分析发现,在猪的性别和卵巢发育成熟过程中存在甲基化的改变。在山羊下丘脑甲基化研究中也存在类似的结果。尽管有这些发现,但是想弄清楚DNA甲基化模式与生产力之间的关系仍然有局限。湖羊被公认为生殖系统成熟早且生产能力强,然而,最近几年的研究中,更多的注意力集中在肉质上,选择过程中关注生殖特征的研究相对较少。繁殖是一个复杂的过程,例如产仔数量这一特征受许多微效基因和一些主要基因的影响。所以了解DNA甲基化在基因功能中的作用非常必要。该研究中选用WGBS的技术对湖羊甲基化进行研究,系统的分析了DNA甲基化模式与产仔数量的潜在关系。另外,此项研究也可以增加对湖羊甲基化的认知和了解。 材料和方法 实验材料:共选取6只湖羊(Hu sheep ),年龄3岁,非妊娠母羊,分为两组: HP组(高生产力组):3只湖羊,有3次产仔记录(n=3,litter size=3) LP组(低生产力组):3只湖羊,有1次产仔记录(n=3,litter size=1) 分别将处于发情期的母羊在12小时内进行屠杀,收集身体同侧的卵巢,迅速用液氮冷冻, -80 °C储存,分别提取DNA和RNA,DNA进行bisulfite处理。 测序平台:北京百迈客生物科技有限公司 IlluminaHiSeq 2500平台,两组分别选取3个样本进行WGBS测序,两组总RNA进行转录组测序 分析平台:所有数据在百迈客云平台(BMKCloud)进行分析,分析内容如下: 1.参考基因组比对 测序片段在进行甲基化分析之前需要与参考基因组比对,通过bisulfite处理和PCR扩增将未甲基化的胞嘧啶(C)转换成胸腺嘧啶(T)。应用Bismark 软件将bisulfite处理的片段与参考基因组(Oar_v3.1)比对,其他数值均选用百迈客云平台的默认参数。用该软件进行测序深度和覆盖度的统计,以及bisulfite转化率统计,甲基化类型确定。Bismark 软件不能辨别单个胞嘧啶位点,参数设置为coverage ≥ 4×,FDR< 0.05。 2.评估甲基化水平以及鉴定DMRs 使用MOABS软件对覆盖度大于10X的胞嘧啶位点进行DMRs(差异甲基化区域)分析,运用如下公式: 3.DMGs(差异甲基化基因)生物信息分析 将DMGs与GO,COG,KEGG数据库进行比对分析这些基因的功能,进行GO富集分析,以及应用KOBAS软件对KEGG通路中显著富集的差异表达基因进行检测。并且利用String数据库对选取的DMGs进行互作网络分析。 结果 1.DNMTs表达水平 首先用qRT-PCR的方法分别对HP组和LP组卵巢中DNMTs(DNMT1, DNMT3A和 DNMT3B)表达水平进行了分析,发现HP组中DNMT1和 DNMT3A的表达水平显著低于LP组(P < 0.05)。 图1. HP组和LP组卵巢DNMTs的表达水平分析 2.DNA甲基化比对以及甲基化模式分析 HP组和LP组每个样平均产生的clean数据分别是63.59G和66.72G。比对率在71.36%-74.68%之间。平均每个组中胞嘧啶位点的甲基化率在3.5%左右。 表1.全基因甲基化测序结果 该研究中发现了3种甲基化的模式:CG,CHG(H 表示 A,C或 T), 和 CHH,这些类型在HP和LP两个组的比例是非常相似的。HP组中:89.78% CG, 2.46% CHG, 7.76% CHH;LP组中:88.60% CG,2.66% CHG,8.74% CHH。 图2.甲基化模式分析 3.甲基化序列偏好性分析 通过小提琴作图分析,图中不同的点代表不同的甲基化水平,且通过横截面积可以看出CG甲基化类型的数量较多,而CHG和CHH甲基化类型的数量较低。通过各样本染色体甲基化图谱的分析发现,染色体中大多数超甲基化胞嘧啶是CG类型的,并且不同组中染色体上的胞嘧啶甲基化位点有差异,如18号染色体。另外,研究者还分析了sequence context和甲基化偏好性之间的关系,统计了所有可能的9个碱基序列甲基化百分比,mC位点处于超甲基化状态中,CAG是CHG甲基化位点中绝大多数共同序列motif,并且两个组中CHH contexts的频率不一样。 图3.各样本甲基化分布小提琴图 4.不同功能区域DNA甲基化水平 研究者将所有的mC分为启动子、5 ’UTR、外显子、内含子、3 ’UTR这几个基因功能区域,通过这些功能区域对甲基化水平进行评估。两组中,各区域表现出相似的甲基化水平,并且CG类型的甲基化水平高于CHG和CHH类型。mC的大部分位点发生在内含子、外显子(第一个外显子除外)及下游区域。此外,在第一个外显子中CG甲基化水平低于除上游区域以外的其他部分,上游区域的甲基化水平表现出下降的趋势,TSS(转录起始位点)附近的CG位点甲基化水平低于首个外显子区域的甲基化水平。另外,在外显子和内含子中检测到高度甲基化,并且这种甲基化水平从启动子区到TSS区逐渐下降,从TSS区到内含子去逐渐增加。CHH类型是低甲基化一类并且在各功能区域较稳定,CHG类型几乎未甲基化。 图4.CGI不同功能趋势图 5.CGI区域甲基化注释 CGI(CG岛)区域功能注释发现,约68%超甲基化CGI分布在基因间区,1.5%的超甲基化CGI分布在UTR区,在两个组中没有显著差异(P > 0.05)。 图5. 不同功能部分CGI甲基化分布比例 6.HP组和LP组DMRs分析 检测两组DMRs以及根据不同的甲基化类型进行基因功能注释。共鉴定了70,899个 CG 类型DMRs, 16 个CHG类型 DMRs以及356个 CHH 类型DMRs。大多数在基因间区,5 ’ UTR 和 3 ’ UTR分别只有33和162个DMRs。基于所有的甲基化类型,除基因间区外内含子中DMRs的比例最高。研究人员还对两组DMRs进行了热图聚类分析。 图6.不同基因功能区不同甲基化模式中DMRs比例 7.测序结果验证 为了验证测序结果,从测序结果中随机选取10个DMGs进行qRT-PCR实验,结果显示HP组中GPNMB,ELK4, BACH1, CDIPT表达水平显著低于LP组,而SCYL1表达水平显著高于LP组(P < 0.05),两组中 ABCG2,mTOR,STK3, ACVR1...