CHIP-SEQ分析平台

染色质免共沉淀技术(Chromatin Immunoprecipitation Assay,ChIP)是一种研究蛋白质与生物体细胞中DNA 相互作用的经典方法,将ChIP与第二代测序技术相结合的ChIP-Seq 技术,能够高效地在全基因组范围内检测与组蛋白、转录因子等相互结合的DNA 区段。ChIP-seq分析平台以Illumina高通量测序数据作为输入,通过比对基因组进行Peak calling,并且可通过对Peak区域关联基因进行功能注释和富集分析预测其参与的生物学通路,是研究蛋白质和DNA相互作用的有力工具。

ChIP-seq能够快速、高效、经济地鉴定蛋白质在基因组中的结合位点,是研究体内蛋白质与DNA相互作用的有力工具,通常用于转录因子结合位点或组蛋白特异性修饰位点的研究。

随着测序成本的不断降低及通量的不断提高,ChIP-Seq已经基本上成为高通量研究蛋白质与DNA相互作用的主要工具,在动植物生长、分化、发育和凋亡等调控研究中得到了广泛应用。

ChIP-seq分析平台基本分析流程可进行测序质量评估、Peak calling分析和Peak关联基因功能注释和富集分析。设定参数后点击提交进行分析,分析完成后在流程定制页面下生成标准化结题报告,实现一键式生成。

ChIP-seq分析平台首先会使用百迈客自主研发的程序对测序数据进行评估,包括测序数据量、数据质量、GC含量等的评估。

数据评估完成之后,流程使用Bowtie 2 [1]软件将测序数据比对到参考基因组上,并统计各样品的测序深度和覆盖度。

基于上述信息,使用MACS [2]软件进行峰提取(Peak calling)并对富集峰进行统计。使用R包ChIPseeker [3]对峰进行注释和可视化,通过BLAST [4]等将Peak区域关联基因比对GO [5]、COG [6]、KEGG [7]等数据库进行功能注释,使用Fisher精确检验、topGO [8]等方法或工具对关联基因集进行GO节点或KEGG通路富集分析。

研究背景

组蛋白修饰在植物发育过程中发挥着重要作用,但是在木本植物中却鲜有研究。研究与木质部形成相关组织的染色体结构及其在在调控基因表达中的作用能够使我们了解木质部形成过程中的细胞分化机制并能够在基因组中鉴定新的功能区。作者通过使用ChIP-seq研究H3K4me3组蛋白修饰在巨桉木质形成早期的组织中调控基因表达的作用。

实验设计

研究选用两株7岁龄的巨桉发育中的次生木质部组织,采用 Illumina测序平台进行ChIP-seq,每个组织分别获得9M ChIP-seq和18M对照PE50测序数据。

信息分析

测序数据经过质量过滤,使用Bowtie2与参考基因组比对,使用MACS进行Peak calling(峰识别),使用IDR进行重复性分析。结合RNA-seq数据基因表达量结果,分析H3K4me3修饰和基因表达量的关系,通过Peak关联基因GO通路分析和富集分析挖掘H3K4me3修饰基因参与的生物学过程。结果表明在巨桉中H3K4me3与转录激活相关,本研究有助于了解植物木质部形成过程中的表观基因组图谱,同时结合RNA-seq表达量的结果可促进基因组注释。

图1 H3K4me3 ChIP-seq峰在基因组不同区域的分布

图2 H3K4me3介导调控巨桉苯丙素生物合成途径