云平台深度解析-小麦与禾谷胞囊线虫在侵染初始阶段的转录组学变化 Transcriptional responses of wheat and the cereal cyst nematode Heterodera avenae during their early contact stage 小麦与禾谷胞囊线虫在侵染初始阶段的转录组响应 杂志: Scientific Reports  影响因子:4.259 PMID:29101332   研究背景: 植物寄生线虫(PPNs)已给许多植物带来了巨大损害。禾谷胞囊线虫Wollenweber隶属禾谷胞囊线虫(CCNS),出现在80%的中国小麦种植区,致使小麦感染并减产30%到100%。许多寄生线虫可繁殖幼虫,幼虫用感官定位宿主,这种复杂的行为与感官能力(如嗅觉、味觉、温湿度感应)有关。可在植物根部与线虫初始接触过程中采取措施进行预防,因此了解寄生虫宿主互作机制具有重要意义。过去大部分研究集中在线虫侵染宿主后不同阶段的转录组学分析,而没有关于侵染前(早期接触阶段)互作机制的探讨。今年11月3日中国农业科学院作物科学研究所的老师们在Scientific Reports 发表了一篇关于小麦和禾谷胞囊线虫在接触早期转录响应机制的研究,填补了国内外研究空白,第一次对小麦和禾谷胞囊线虫互作早期转录组响应进行了系统性的描述。   材料和方法 实验组:Wenmai19小麦幼苗(根长2–3 cm )与J2s;对照组:仅Wenmai 19小麦幼苗或仅J2s。 处理3h后提取RNA测序。实验组小麦根尖染色镜检。每组三个重复。测序后分别对小麦和线虫DEGs进行了鉴定注释,并对线虫的效应基因进行了预测及BT-PCD验证。 测序平台:百迈客HiSeq4000测序平台 分析平台:百迈客云平台(BMKCloud) 研究结果: 1.转录组分析采样时间点确定 CCN易感小麦品种Wenmai19吸引禾谷胞囊线虫J2s。小麦根尖周围聚集的J2线虫数量在3h达到峰值,且J2s未渗入根内部。选择此时小麦根、线虫样品进行转录组分析。 2.小麦根尖转录组数据 实验组、对照组小麦根尖样本共得到52.23 Gb的clean reads,每个样本≥8.25Gb,Q30≥90.4%。每个样品的clean reads与小麦参考基因组比对效率为64.0%至67.3%,并与唯一或多基因组位置匹配(表1)。小麦转录组中,共发现109,496个unigenes,包括9152个新基因。与Nr、Swiss-Prot、GO、KEGG、COG等数据库比对后,共注释了6,780个新基因。数据重复性较好。 表1 小麦参考基因组比对结果 3.小麦基因表达响应分析 实验组、对照组基因表达分析得到93个差异表达的unigenes(66个下调,27个上调),FDR<0.05和FC≥1.5(图1)。对12个DEGs进行了qPCR验证,其中11个DEG的表达模式与mRNA测序结果一致。结果表明即使未受感染,J2线虫在小麦根部聚集也会触发小麦的响应。 图1 实验组对照组小麦DEGs的火山图 功能注释的结果表明,所有的DEG都能与Nr数据库比对上,其中一些在Swiss-Prot、GO、KEGG、COG数据库中也有注释信息(表2)。 表2 小麦与禾谷胞囊线虫的DEGs的功能注释 GO富集分析将小麦DEGs分为28个功能组,归为3大类:生物学过程(60个)、细胞成分(54个)、分子功能(68个)(图2a)。 图2a小麦根尖unigenes 和DEG unigenes的GO分类 在生物过程类别中,与所有小麦根的unigenes相比,大部分DEG与代谢过程、单一生物过程、对刺激的反应相关。细胞成分类别中更多DEGs位于细胞外区域。 在分子功能类别,与所有unigenes相比,DEG更多富集于营养储存活性,抗氧化活性,电子载体活性,酶调节活性和催化活性等GO分类。 KEGG通路分析来确定DEGs的生物学功能。将31个DEG分配到21个KEGG通路(图3a)。最多数量DEGs归类于苯丙素生物合成通路,其次是谷胱甘肽代谢,苯丙氨酸代谢、淀粉和蔗糖代谢。6个DEG与苯丙烷相关通路有关,在线虫侵染的小麦根中全部下调,其中两个基因Traes_1AS_F9013A945和Traes_2AS_EE549925C,经qPCR验证有相似的表达模式。 图3a.小麦根尖DEGs的KEGG分析 COG注释后,小麦29个DEGs被分为6个COG功能类别,包括能源产生于转换;次级代谢物合成运输和代谢;仅一般功能预测;翻译后修饰、蛋白质转换,分子伴侣;氨基酸转运代谢;碳水化合物转运代谢(图4a)。 图4.DEGs的COG功能注释 a 小麦根系 b禾谷胞囊线虫 4.小麦DEGs生物胁迫通路图谱 MapMan分析显示小麦许多DEGs能比对到生物胁迫通路(图5):29个小麦DEGs能和生物胁迫通路相关的33个数据点比对上,DEGs包含过氧化物酶,谷胱甘肽S转移酶,激素信号传导(生长素和茉莉酸),发病相关蛋白和次级代谢物。这些DEGs大多数在生物胁迫通路中表达下调。qPCR分析其中8个DEGs,除一个之外,其他的表达模式与测序结果一致。 图5.小麦DEGs生物胁迫通路 在氧化还原反应通路中,3个DEGs与过氧化物酶和谷胱甘肽-S-转移酶通路比对上,且全部下调,表明氧化还原反应减弱。在激素信号传导通路中,生长素和茉莉酸(JA)通路各包含2个下调的DEGs。 有7个数据点与6个下调的DEGs比对上,几乎都与苯丙素类黄酮代谢通路有关。编码PR蛋白的防御基因有3个下调的DEG,1个下调的DEG,与细胞壁蛋白比对上,1个表达上调的DEG与细胞壁修饰通路有关。 2个下调的DEG,2个上调的DEG可比对到蛋白酶和泛素相关蛋白水解通路。 1个上调的DEG与突发性呼吸相关,隶属乙烯应答元件结合蛋白家族的转录因子,可比对到Traes_5DL_41E3B1B23基因,是一个上调DEG(注释ERF071)。 5.CCN的转录组数据 实验组、对照组CNN样本得到30.47Gb的clean reads,每份样本≥4.13Gb,Q30≥89.1%。共得到194,662个转录本和80,124个unigenes(表3)。unigenes的总长、N50长度、平均长度分别为61,659,712bp,955bp、769.55bp。长于1 kb的unigenes有15,197个。每个CCN样本与组装数据的比对效率在73.2%至79.2%之间。根据Nr、Swiss-Prot、GO、KEGG、COG、KOG、Pfam数据库,共注释了43741个unigenes。CCN样本重复性良好。 表3 禾谷胞囊线虫的组装转录本及unigene一览 6.CCN基因对于小麦根吸引的响应分析 实验组、对照组CNN比较得到879个DEGs(FDR <0.01和FC≥2)。867个上调,仅12个下调。对10个DEG的表达模式进行qPCR验证,结果与测序结果一致。表明CCNs通过小麦根的刺激激活,大部分基因上调。 DEGs的功能注释,GO富集分析把258个DEGs归类到三大类的36个功能组中:生物过程(159个)、细胞成分(107个)、分子功能(223个)(图2b) 图2b 禾谷胞囊线虫unigenes 和DEG unigenes的GO分类 KEGG分析将247个DEGs归到125个KEGG路径,50个最显著的通路中,核糖体通路有最多的DEG数(64个)(图3b),其他DEG较多的通路为细胞色素P450外源物代谢,谷胱甘肽代谢和Toll样受体信号通路。表明CNN被小麦根部吸引时CNN的蛋白翻译更活跃。 图3b.禾谷胞囊线虫DEGs的KEGG分析 共386个DEGs归类于22个COG功能类别。前四个DEG数目最多的COG类别为仅一般功能预测(90个);翻译,核糖体结构和生物起源(65个);能量产生与转化(45个);氨基酸转运代谢(44个)(图4b)。 7.CNN效应基因预测 搜集PPNs的351个已知效应子基因序列,并将CCN的DEGs与这些序列进行比对。推测6个DEG与已知效应基因14-3-3,几丁质酶,β-1,4-内切葡聚糖酶,果胶酸裂解酶或组织蛋白酶具有同源性(表4)。比对上的效应基因的描述和DEG的Nr注释一致。对这些DEGs结构域进行了预测,结果也与基因描述一致(图6,表4)。当J2线虫与小麦根接触时,编码候选效应蛋白的DEGs全部上调。 表4.根据禾谷胞囊线虫DEGs预测的效应基因 图6 禾谷胞囊线虫的6个候选效应基因的结构域 8.效应基因的植物防御抑制验证 选择两个预测的效应基因c68622.graph_c0和c72543.graph_c0,在本氏烟草中进行程序性细胞死亡(BT-PCD)抑制来验证其抑制植物防御的能力。 BAX加入后,在c68622.graph_c0,没有明显坏死,而c72543.graph_c0则明显坏死(图7)。BT-PCD抑制试验的两个重复结果一致。表明前者抑制BT-PCD,而后者不抑制。c68622.graph_c0是来自H.avenae DEGs的候选基因,可能在抑制植物防御中发挥作用。 图7.(a)c68622.graph_c0和(b)c72543.graph_c0在本氏烟草中BT-PCD的试验 结论: 本文拟研究在线虫与小麦根部在早期接触阶段的相互作用机制,通过mRNA测序对小麦和禾谷胞囊线虫在接触早期的转录组响应进行了分析,鉴定了的宿主小麦根部的93个DEGs(27个上调,66个下调),寄生线虫的879个DEGs(867个上调,12个下调)。其中一些小麦DEGs(主要是下调的)与生物胁迫途径相关,线虫DEGs中几个推定的效应基因表达上调,线虫的几丁质酶样效应基因能抑制本氏烟草中BAX引起的细胞程序性死亡。以上结果表明,在寄生初始接触阶段,线虫的响应比小麦更活跃。寄生虫的响应主要与基因(包括至少一个抗植物防御效应基因)的上调相关,而宿主响应主要与某些防御基因下调相关。     创新点: 第一个对小麦和禾谷胞囊线虫互作早期转录组响应进行系统性描述的研究。 参考文献: Chen C, Cui L, Chen Y, et...

Transcriptome Profiling of Watermelon Root in Response to Short-Term Osmotic Stress 短期渗透胁迫下西瓜根组织的转录组研究 杂志: PLOS ONE 影响因子:2.806 PMID:27861528     研究背景: 干旱是影响农业生产力、限制物种分布的重要因素。干旱会影响植物某些生理生化过程(如蒸腾作用、光合作用、呼吸作用、碳水化合物和激素代谢)。植物进化出多种应对机制(包括逃旱性,避旱性和抗旱性),这种机制涉及精细复杂的代谢网络及多分子通路间的相互作用。 西瓜富含必需营养成分(如糖、番茄红素、对心血管有益的氨基酸类),是一种在世界范围内广泛种植的瓜类作物。干旱会减少西瓜产量,栽培西瓜较野生西瓜抗旱性更强,但相关研究较少。M08是一种栽培西瓜近交品种,抗旱性强。为了解栽培西瓜根系对渗透胁迫响应分子机制及相关调控网络,本研究进行了渗透胁迫下西瓜根系的比较转录组学研究。 材料和方法 PEG6000处理的M08植株幼苗根系,依据处理0、3、6、12、24h时表型和Cla007307 (WRKY) and Cla006761 (MYB)基因转录水平来确定mRNA测序时间点。实验组(T-1,T-2,T-3),与对照组(CK-1,CK-2,CK-3)一起进行mRNA测序。 测序平台:百迈客Illumina HiSeqTM 2500平台 分析平台:百迈客云平台(BMKCloud)具体分析如下: 矫正后clean reads比对到西瓜参考基因组(TopHat ),基于DESeq进行差异表达基因(DEGs)分析(FC≥2,FDR<0.01),随后进一步进行GO分析、GO富集、KEGG通路分析。 研究结果: 转录组测序时间点选择 西瓜幼苗在渗透胁迫下,6h时出现枯萎,12h和24h时出现严重枯萎(图1A)。 Cla006761上调并在6h时达到最高,Cla017928下调在6h达到最低值(图1B)。结合幼苗表型及Cla017928和Cla006761的动态表达结果,选择处理6h的样本进行RNA测序。 图1A M08幼苗在渗透胁迫处理不同时间的表型特征 图1B 渗透胁迫下P5CS、MYB基因表达的动态变化 测序结果 6个文库共得到32.99 Gb的clean reads,每个文库>40M(表1)。unique mapped reads的比例为8.513%到86.10%,测序数据质量高。 表1.测序数据  qRT-PCR验证18个不同表达水平的基因,验证结果与测序结果一致。生物学重复间相关性评估结果显示相同处理组高度相关,CK和实验组相关性弱。以上结果均表明测序数据结果可靠。 DEGs鉴定 基于DESeq进行DEGs分析,共鉴定出渗透胁迫下5246个差异表达基因,其中2753个上调,2493个下调。DEG包含大量不同的基因,说明西瓜根系对干旱响应涉及复杂的调控机制。 GO分类和KEGG分析 将DEGs在与COG(2174),GO(4528),KEGG(1203),Swiss-Prot(3954)、NR(5173) 比对后,共注释了5175个DEG 。用BLAST2GO检索GO数据库中的DEG并用WEGO进行GO功能分类。将4528个DEG归为以下三类:生物学过程(4148),分子功能(3670)和细胞成分(4177)(图2)。 图2.GO分类 富集的GO terms包含缺水响应、高渗盐度响应、乙烯响应。此外几个高度富集的terms(植物型超敏响应调节、损伤响应、真菌防御响应、防御响应突发性呼吸)在西瓜根部不同胁迫响应中相互作用,与其他植物中的结果一致。 一些与根生长相关的生物学过程是显著抑制的,如细胞增殖、分生组织生长调节、有丝分裂细胞周期的G2/M转换、细胞板形成的胞质分裂、核糖体生物起源、核糖体、微管、翻译、DNA复制调控、DNA复制起始等。说明PEG诱导的渗透胁迫可能会抑制西瓜根系生长。 植物激素在不同胁迫响应中起重要作用,本研究中大部分涉及激素介导的信号传导途径、乙烯响应、水杨酸生物合成过程的基因表达上调。 蛋白折叠影响蛋白质功能,破坏内质网腔蛋白折叠的多种信号可激活未折叠的蛋白质发生响应,甚至致使细胞程序性死亡(PCD)。内质网未折叠蛋白质响应是本研究中高度富集的term,表明渗透胁迫会影响蛋白折叠。在渗透胁迫时,根尖分生组织自噬PCD激活,根尖优势丧失,根系结构发生重构来适应渗透胁迫。富集到的GO terms包含细胞程序性死亡调节、根形态发生,表明渗透胁迫下PCD程序可能在根尖分生组织中激活,同时发生根系结构重构。 KEGG分析结果显示共825个分配到108个不同的生化途径。DEG最多的前5个途径分别是核糖体、植物激素信号转导、植物病原体相互作用、嘌呤代谢、淀粉蔗糖代谢途径(图3)。其中核糖体途径变化显著。大部分核糖体通路中的基因都是下调的,与GO分析结果一致。 图3.KEGG分析   渗透胁迫响应的保护基因 参与渗透调节的基因 在渗透胁迫条件下,相容性溶质分子(如脯氨酸,甜菜碱和海藻糖)会增加,来维持细胞膜结构,细胞膨压和水平衡。P5CS是高等植物脯氨酸合成的限速酶,鸟氨酸氨基转移酶(OAT)是脯氨酸合成鸟氨酸途径中的脯氨酸合成酶。在渗透胁迫下,根中P5CS(Cla017928)和OAT(Cla019569)表达下调。而编码脯氨酸脱氢酶的Cla016474(ProDH)上调。在渗透胁迫下TPS基因(Cla019181,Cla010101和Cla009709)和TPP基因(Cla005675,Cl008123,Cla006270和Cla014481)表达上调,参与蔗糖和肌醇半乳糖苷代谢的基因显著上调,另外四个淀粉酶基因也是上调的。 活性氧(ROS)清除 ROS是有氧代谢过程中重要信号转导分子及毒副产物。非生物胁迫(如干旱、高盐、洪水、寒冷和炎热)会扰乱细胞代谢平衡,致使植物ROS生成过量,从而损伤蛋白质,脂质,碳水化合物和DNA。突发性呼吸氧化酶同系物(Rboh)蛋白与ROS产生有关。植物进化出一些高效酶(如超氧化物歧化酶,过氧化氢酶,过氧化物酶和抗坏血酸过氧化物酶),以及非酶抗氧化剂(ASH、GSH)来清除过量的过氧化物自由基。在本研究中,编码Rboh的四个基因显著上调。抗坏血酸过氧化物酶,谷胱甘肽还原酶、单脱氢抗坏血酸还原酶,脱氢抗坏血酸还原酶,谷胱甘肽过氧化物酶以及大部分谷胱甘肽-S-转移酶和过氧化物酶基因表达上调,但超氧化物歧化酶基因Cla011317表达下调。这些结果表明渗透胁迫可能诱导复杂的抗氧化网络。此外也富集到与维持细胞氧化还原稳态相关的硫氧还蛋白和谷氧还蛋白相关转录本。 其他渗透保护相关DEGs MATE是一组新发现在胁迫响应中发挥重要作用的转运蛋白。本实验共得到18个MATE转运蛋白相关的DEG。水通道蛋白是一种膜蛋白,能促进水分跨膜转运并维持细胞水平衡。本研究中,共8个编码水通道蛋白的基因显示出差异表达。LEA蛋白是重要的细胞脱水保护蛋白,其表达量与耐脱水性相关,在渗透胁迫下有两个LEA(Cla015386和Cla009416)上调。此外编码分子伴侣(如热休克蛋白(HSP),分子伴侣,DnaJ样蛋白)的DEGs也是差异表达的。 蛋白激酶,磷酸酶和转录因子相关的DEGs 渗透胁迫诱导植物中的钙信号,本研究涉及Ca2 +结合蛋白的DEGs在渗透胁迫下表达上调。Map激酶级联成员在渗透胁迫中起重要作用,本研究检测到13个编码MAP激酶的DEGs,几个与SnF1相关蛋白激酶,丝氨酸/苏氨酸蛋白激酶和磷酸酶有关的DEGs表达上调。在磷脂信号系统中,磷脂酶催化IP3和DAG等信使形成以调节胁迫响应基因的表达。在本研究中检测到与磷脂酶相关的DEGs(包括PLA、PLC、PLD)。许多功能基因的表达主要受特定转录因子调控。我们结果中也列出了转录因子家族的DEGs。     7.植物激素相关DEG 植物激素介导植物对生物/非生物胁迫的响应,对于植物适应环境变化具有重要意义。本研究结果中列出了与脱落酸(ABA),生长素,细胞分裂素,赤霉酸(GA),乙烯和茉莉酸(JA)等植物激素信号相关的DEGs。 编码ABA生物合成关键酶NECD的Cla009779和Cla005404基因表达上调,与乙烯合成相关基因(如ERF转录因子、ACS、ACO等)的表达上调。吲哚-3-乙酸(IAA)是植物中的主要生长素,由色氨酸(Trp)依赖/非依赖性途径合成。YUC家族和TAA家族的色氨酸氨基转移酶是Trp依赖途径中的IAA生物合成中的关键酶。我们结果中,两个YUC和一个TAA表达下调,生长素转运蛋白基因如LAX和PIN表达也下调。GA是调控植物生长发育的重要植物激素,本研究中编码GA生物合成关键酶的基因(Cla021351)表达下调,而编码GA2-氧化酶(GA2ox)的转录本表达上调,这可能使GA的内源性水平和生物活性下降。此外,茉莉酸和细胞分裂素的生物合成途径的转录本也受到渗透胁迫的影响。      8.其他DEGs 许多与细胞分裂和根生长相关的DEGs表达下调,如CYC、CDK、MAP、Ran、E2F、DOF、核糖体、肌动蛋白和微管蛋白等。 泛素26S蛋白酶体系统(UPS)可去除非生物胁迫导致的错误折叠或损伤蛋白质。E3连接酶除在UPS中发挥重要作用外,还可调节ABA依赖的应激信号。本研究得到了许多E2结合酶、E3-蛋白连接酶相关的DEG,说明渗透胁迫可诱导UPS去除机制和E3调节机制的发生。 结论: 渗透胁迫影响西瓜的生长、品质和产量。增强西瓜对高盐,缺水等因素引起的渗透胁迫耐性是提高生存率的有效途径。根系是重要的吸水组织,参与渗透胁迫的初始反应。为了更好地阐述西瓜根系组织应对短期渗透胁迫的分子机制,将西瓜自交系M08用20%的PEG6000处理6h,未处理根组织作对照,进行了全基因组差异基因表达分析。RNA-seq得到32.99Gb的高质量数据。数据集阐述了基因表达谱,鉴定出5246个差异表达的基因,GO富集和KEGG分析表明,短期渗透胁迫影响渗透调节,信号转导,激素应答,细胞分裂,细胞周期和核糖体等过程,M08根组织对短期渗透胁迫响应适应过程与渗透调节,ROS清除、渗透胁迫信号转导和根系生长抑制等通路有关(图4)。 图4.渗透胁迫下西瓜根系DEGs总览 创新点: 这是第一个栽培西瓜品种根系渗透胁迫响应的比较转录组学研究,为深入探讨西瓜根系渗透胁迫响应分子机制提供了新的思路。 参考文献: Yang Y, Mo Y,...

PMID: 27934932 杂志:Scientific reports 影响因子:5.228   研究背景:目前蛋白编码基因的功能已有了比较广泛的研究,但对非编码RNA(ncRNAs)功能的了解还非常少,先前ncRNAs被简单视为转录过程中内含子和基因间区积累的碎片。近期的研究发现,ncRNAs可能在很多生物、病理和发育过程中发挥关键的作用,比如它们可以调节mRNA的翻译,对细胞行为起决定性作用。但是到目前为止,我们对大部分ncRNAs的确切功能,甚至他们的表达谱还知之甚少。ENCODE计划在人lncRNA和小鼠组织特异性元件的鉴定方面取得了很大进展,但是很少有研究报道lncRNA在小鼠的脑、心脏和肝脏发育中的作用。此外,以往的研究表明非编码基因比编码基因对器官和年龄因素有更高的敏感性。因此,对大鼠不同发育阶段中不同器官的非编码基因的全面鉴定和注释就显得非常重要。 公共原始数据获取: 从GEO数据库中下载得到Ying等人上传的原始测序数据(GSE53960)。数据集中包含来自32只大鼠的320个bodymap样本(每只大鼠包含肾上腺、脑、心脏,肾、肝、肺、骨骼肌、脾脏、胸腺、睾丸或子宫10种不同器官)的转录组测序数据。Ying等选取了2周、6周、21周和104周四个时间点,每个时间点处死雌、雄两只大鼠,进行四次生物学重复。 技术路线: 实验结果: 1.大鼠非编码基因表达谱 为了获得大鼠非编码基因表达谱的概览,作者首先提取了FPKM>0.01 的3,458个非编码基因的表达值,其中54.8%(1,895)是假基因、33.5%(1,158)是miRNA、6.8% (237)是lncRNA(Fig.1a)。分层聚类分析显示,非编码基因的表达谱明显按器官类型聚类,比编码基因表现出更高的器官特异性。PVCA分析发现在数据集中方差贡献率最多高的是器官(62.94%)(Fig.1b)。在非编码基因表达谱的总体方差中年龄(2.82%)贡献率超过了性别(0.13%)贡献率(Fig.1d)。   Figure 1. Expression profiling of noncoding genes  2.年龄和性别相关非编码基因的差异表达分析  利用Cuffdiff对非编码基因在基因和转录水平进行了分析。统计结果发现,除肾上腺和心脏外雄性大鼠比雌性大鼠共享更多的发育阶段依赖性DEnGs。所有组织中DEnGs的数目从19(雌性大鼠脑)到503(睾丸)不等(Fig.2a)。肾上腺、心、肾、肝、肌肉和胸腺表现出相当数量的发育阶段依赖性DEnGs,脑和肺中DEnGs的数量最少。 性别相关的DEnGs不仅取决于器官,还与年龄相关。脾脏中性别相关的DEnGs数量最多的,而肺中最少,在所有发育阶段中肾上腺和胸腺显示相当一致的DEnGs数量。在幼鼠的大多数器官中性别特异性非编码基因大量表达,而青春期的大鼠性别特异性的非编码基因表达较少。幼鼠大脑中性别相关DEnGs的数量最多,这可能与发育早期大脑快速的发育速度有关(Fig.2b)。   Figure 2. Identification of differentially expressed noncoding genes  3.脑和睾丸中有大量非编码基因表达  当比较不同器官对时,DEnGs的数量有了很大的变化。四个发育阶段中脑和肝脏与其他器官相比时获得了相对较多的DEnGs。睾丸和胸腺中DEnGs的数量表现出明显的年龄依赖性。与其他器官相比,第6和21周的大鼠睾丸中存在最大数量的DEnGs(Fig. 2c)。 4.共表达网络的构建 为了注释大鼠非编码基因功能,作者构建了蛋白编码基因和非编码基因之间的共表达网络,包含3572个与年龄相关的蛋白质编码和非编码基因,1603性别相关基因,和16346个器官相关的基因。并通过GO分析检测共表达分析模块是否富集在特定的生物学过程中。 5.年龄相关的基因共表达模块与细胞分裂、细胞周期和免疫系统发育有关 在与年龄相关的基因共表达网络中,发现了包含3572个基因的14个稳定模块(Fig. 3c)。蓝色的模块包含1151个基因(其中有60个非编码基因)被显著富集到诸如细胞周期过程,细胞分裂,有丝分裂,以及转录调节和RNA代谢调节GO条目中。这些条目富集结果说明发育差异与生长发育过程中的代谢变化和基因表达调控有关。通路分析显示细胞周期和碱基切除修复相关基因被显著富集,提示细胞周期和自我修复功能可能受老化影响。其他模块如棕色和绿色显示出另一个免疫系统相关的富集趋势,如免疫反应、免疫系统发育和淋巴器官发育。很多脑、脾脏和胸腺中的年龄相关基因与癌症和其他年龄相关疾病关联,这提示衰老可能是通过影响免疫系统导致这些疾病的发生。其他基因主要涉及帮助免疫系统抵御炎症和转移白细胞以建立机体的防御系统。最后,粉红色模块中的七个非编码基因与骨骼系统的发育有关。   Figure 3. Co-expression network construction on age-related genes. 本文还利用相同的方法构建了器官相关和性别相关基因的共表达网络,结果显示器官相关模块很大程度上取决于不同组织类型的功能,性别相关模块中包含性别发育相关基因。 6.年龄相关棕色模块的可视化分析显示枢纽编码基因在网络中的调节作用 作者通过关联3,572个年龄相关基因中的特征向量基因研究模块和年龄之间的关系(Fig.4a),毗邻关系反应模块的相关性。包含许多非编码基因的棕色模块与年龄有相对紧密的关系。因此选取了此模块中189个与衰老相关的基因(包括七个非编码基因,阈值为0.32)进行进一步的网络可视化分析,获得了两个主要的集群,其中有几个中心基因连接着相邻基因。虽然非编码基因不在网络的中心,但是七个大鼠的非编码基因与免疫系统相关基因共同参与网络运作。   Figure 4. Network visualization of age-related brown module. 结论:利用大鼠bodymap RNA-seq数据构建了大鼠4个发育阶段、11个组织中的3,458个非编码基因的表达谱。构建了一个推断蛋白质非编码基因生物学功能的编码和非编码基因共表达网络,年龄相关模块被富集到免疫系统发育相关条目。年龄相关棕色模块的可视化分析发现大鼠非编码基因与免疫系统相关基因共同参与网络运作。 创新点:本文提供了一个鉴定和注释大鼠非编码基因的模型,涉及到多个器官和雌雄两性的不同发育阶段。建立了一个全面、可靠的推断多个器官之间随发育变化的非编码基因表达平台,为以后大鼠中非编码基因表达谱研究奠定了基础。...

PMID: 27922056 杂志:Scientific reports 影响因子:5.228   研究背景:随着高通量RNA-seq技术的发展,已经在许多物种中鉴定出了大量的基因间长链非编码RNA(lincRNAs)。有研究表明,一些lincRNA在植入前胚胎发育(PED)过程中发挥重要作用。猪是一种理想的生殖和生物医学应用研究模型,然而对猪lincRNAs的研究还比较欠缺,因此需要对lincRNAs进行全面的全基因组范围鉴定。此外,合子基因组激活(ZGA)对成功的移植前胚胎发育至关重要,因此需要对ZGA的具体分子机制进行研究。目前很少有研究报道猪PED中转录组的变化情况,对PED中lincRNAs的功能研究还很有限。 公共数据获取: 从NCBI-SRA数据库中下载得到五个猪RNA-Seq数据集,Supplementary Table S1中列出了RNA-seq数据编号和详细信息。 Supplementary Table S1 Details of RNA-seq data 技术路线: 实验结果: 1.基于猪RNA-seq数据集的lincRNAs鉴定 本文利用5个包含猪各种组织或细胞的RNA-seq数据(Supplementary Table S1)对linckRNAs进行了全面鉴定。经reads mapping和转录本组装后从122,007个基因座鉴定出了195,531个转录本。排除已知mRNA并进一步筛选后获得了7,618个lincRNA。 2.猪lincRNA的结构特点 作者对预测获得的lincRNAs和Ensemble中记录的mRNAs进行了比较,发现lincRNAs中的外显子明显较少(平均值:lincRNAs 2.97个、mRNAs 8.49 个; Kolomogorv-Smirnov Test, P-value<2.2×10−16)(Fig. 2A)。而猪lincRNAs外显子长度比蛋白编码基因长(平均值:lincRNAs 484bp、mRNAs 307bp; Kolomogorv- Smirnov Test,P-value<2.2×10−16)(Fig. 2B)。由于较少的外显子数量,整体lincRNA长度小于蛋白编码基因的转录本长度(平均值:lincRNAs 1338 bp、mRNAs 2842 bp;Kolomogorv-Smirnov Test,P-value<2.2×10−16) (Fig. 2C)。 Figure 2. Features of pig lincRNAs.         3.猪lincRNAs的低表达量和组织特异性         对不同组织和细胞系中lincRNAs的表达模式分析结果显示lincRNAs与蛋白编码基因相比表达量较低。为了定量评估每个转录本的表达特异性,作者应用依赖于Jensen-Shannon(JS)距离算法的基于熵度量法计算每个转录本的表达特异性。结果显示,lincRNAs比蛋白编码基因表现出更高的JS平均值(Fig. 3B),这说明lincRNAs比蛋白编码基因有更高的组织特异性。 Figure 3. Characteristics of pig lincRNAs expression.         4.lincRNAs与邻近蛋白质编码基因之间潜在的顺式作用关系         研究表明,lincRNAs可能通过正、负两种方式调节邻近蛋白编码基因表达。通过GO分析发现猪lincRNAs的邻近蛋白编码基因被富集到“转录调控”功能。对lincRNA与邻近蛋白编码基因的转录起始位点(TSSs)距离的分析发现了462个TSSs距离在4kb以内的lincRNA:mRNA对。值得注意的是lincRNA:mRNA对中32%的lincRNAs始于400nt内,而mRNA:mRNA对只有12%(Fig. 3D)。这些结果说明猪的lincRNAs可以顺式调节他们邻近蛋白编码基因的表达。 5.植入前胚胎发育相关lincRNAs的功能分析 过滤除去每个胚胎发育阶段的低方差lincRNAs和mRNAs后,进行了共表达网络分析(WGCNA)探索猪PED过程中lincRNA的作用。通过无监督聚类分析鉴定出了23个共表达模块(Fig. 4A)。其中5个模块显示发育阶段特异性(Fig. 4B),它们可能代表每一个过渡阶段的核心基因网络。为了进一步预测lincRNAs在猪PED过程中发挥的功能,作者对每个阶段特异性模块进行了GO富集分析,发现对应ZGA的4细胞到8细胞转变阶段的模块被富集到转录调控、表观调控和细胞周期条目中(Fig. 4C)。 Figure 4. Function prediction of PED associated lincRNAs.         6.猪植入前胚胎发育枢纽 linckRNA的鉴定         为了鉴定猪PED中的枢纽linckRNA,作者利用WGCNA测量了模块内的基因间连接,并提取了每个阶段特异性模块中的前100个枢纽基因。然后在4细胞阶段特异性模块中的枢纽基因集中选取10个lincRNAs进行了qRT-PCR分析,发现这些lincRNAs在生殖组织中作为一个整体表达(Fig. 5A)。研究还发现在卵巢中高表达的两个lincRNAs:tcons_00166370和tcons_00020255 在4细胞阶段显示出明显的激活趋势,而8细胞阶段迅速下调(Fig. 5B)。尽管这些参与猪PED过程的lincRNAs的作用机制还不清楚,枢纽lincRNAs的鉴定为进一步的功能研究提供了宝贵的资源。 Figure 5. The expression of two hub lincRNAs from 4-cell stage-specific module in different tissues and PED. 结论:进行了完整的猪lincRNAs分析,提供了首个猪植入前胚胎发育相关lincRNAs图谱。WGCNA分析显示PED相关lincRNAs与细胞周期调节、转录和表观调控过程有关。对枢纽lincRNAs的qRT-PCR分析发现了两个与PED密切相关的lincRNA:TCONS_00166370 和TCONS_00020255。...

Populus simonii × Populus nigra WRKY70 is involved in salt stress and leaf blight disease responses 小黑杨WRKY70基因在盐胁迫和叶枯病响应中的作用 杂志:Tree Physiology 影响因子:3.653 PMID: 28369503 研究背景: WRKY超家族是重要的植物转录因子(TF)家族成员,其DNA结合域有保守的N端WRKYGQK七肽。WRKY蛋白可特异性识别结合靶基因启动子的顺式元件(CE),w-box(TTGACC/T)。过去20多年的研究表明WRKY是多种生物学过程(如种子休眠/萌发、衰老、发育和生物/非生物胁迫响应)信号网络的关键节点。WRKY蛋白通常会激活或抑制植物的转录调控过程,一些WRKYs甚至同时具有激活和抑制作用。一种WRKY 转录子也可调节几个不同生物学过程。 植物常受到各种生物/非生物胁迫。盐和病原体胁迫是常见的环境刺激,盐胁迫会影响离子渗透压平衡,排毒及生长调节过程。菌类胁迫会使植株产生叶斑,腐烂和枯萎。植物进化出精细响应调节机制来适应这些胁迫,许多TFs是生物/非生物胁迫信号响应网络中重要的调控点。WRKY蛋白作为一种重要的胁迫响应TFs,参与了广泛的生物和非生物胁迫响应过程。 小黑杨在中国北方分布广,这种杂交白杨生长迅速,能很好地适应高盐,寒冷,干旱和贫瘠的环境,因此是一种研究木本植物胁迫响应机制的理想材料。我们既往转录组分析结果表明,在小黑杨受到链格孢侵染或在盐碱、干旱和重金属胁迫下PsnWRKY70基因的表达量发生显著变化。我们推测PsnWRKY70基因可能在小黑杨生物/非生物胁迫响应调控网络中发挥重要作用。既往在WRKY蛋白的生物功能方面的研究进展较多,但关于调控机制的阐述有限。因此进一步研究PsnWRKY70转录子在小黑杨胁迫响应调控网络中的作用具有重要意义。 材料和方法 材料:小黑杨 培养条件: 盐胁迫实验:在25-32℃温室,自然光照条件下,140mM的NaCl溶液处理 叶枯病胁迫实验:条件为:白天/晚上气温,25℃/20℃;湿度,50-60%;光周期,16小时光/8小时黑暗;光合光子通量,150 μmol m-2 s-1。 处理组: .盐胁迫实验组:2个月月龄的NT,OEX和REX植株每隔三天用140mM的NaCl溶液处理。 叶枯病胁迫实验组:2个月月龄的NT,OEX和REX植株喷洒链格孢菌孢子悬液。在处理前(0 h)和处理后36 h收集第三至第五功能叶片用于提取RNA。分别在0天,处理后3、6、9、12天收集第六到第八个功能叶用于MDA含量测定。 对照组:用水处理,所有样本三个重复。 转录组分析:在叶枯病抗性分析培养条件下培养的NT、OEX1和REX1的植株,长到30厘米后用140 mM的NaCl溶液处理。收集盐胁迫36小时后的第五个功能叶(两个重复) 测序平台:百迈客高通量测序平台Illumina HiSeq 4000 分析平台:百迈客云平台(BMKCloud)主流程和小工具 方法: 本文拟研究小黑杨的生物/非生物胁迫响应调节网络。进行了下列实验: 启动子克隆及序列分析:为全面了解PsnWRKY70基因的生物学功能,对PsnWRKY70启动子进行克隆,并对启动子CEs进行了生信分析,预测了PsnWRKY70的转录起始位点(TSS)并进行PCR验证。 2.酵母单杂交筛选和验证:进行了酵母单杂交筛选来研究PsnWRKY70基因的上游调控子,并对PsnWRKY70,PsnMYB,PsnNAM和PsnGT1蛋白质与PsnWRKY70基因启动子互作关系进行分析。 3.PsnWRKY70基因序列和表达分析:对PsnWRKY70基因开放阅读框和保守域进行预测,确定了PsnWRKY70 TF的物理化学参数,预测了亚细胞定位。并与TAIR和RGAP数据库部分拟南芥和粳稻的Group III WRKY TFs序列进行多重序列比对(ClustalW)构建得到不同物种32种WRKY蛋白的系统进化树(MEGAver.6.0)。 4.基因克隆、遗传转化和验证:克隆了PsnWRKY70的开放阅读框架(ORF)并融合到绿色荧光蛋白(GFP)中,OEX和REX载体通过农杆菌介导的叶片转换法将重组子转移到小黑杨中。并进行了PCR、Northern blot、表达量水平的验证。 5.胁迫分析:根据表型、损伤指数、丙二醛(MDA)含量和基因表达模式对转基因和非转基因(NT)组的盐胁迫耐力和叶枯萎病抗性进行评价和比较。 6.转录组分析:为进一步确定了PsnWRKY70 转录子的盐胁迫反应调节机制,选择盐胁迫处理的转基因和NT叶片作为样本进行转录组测序和分析。 研究结果: 1.启动子分析和酵母单杂交实验 克隆了2471bp的PsnWRKY70基因的启动子序列,分析显示提示许多胁迫响应CEs存在于PsnWRKY70的启动子区域,这些CEs中,W-box(TGAC)和GT1元素(GAAAAA)是高度富集的,酵母单杂交筛选结果显示,有五个基因(PsnBTB/POZ、PsnCCD1、PsnZFP、PsnWRKY70、PsnFP)可与W-box及其相邻序列结合,同时七个基因产物(PsnNAM、PsnDDS1、PsnMYB、PsnLHTP、PsnGT1、PsnETIF6-2、PsnAPD)可与GT1元件和其邻近序列结合。 为进一步证实PsnWRKY70 /PsnMYB / PsnNAM /PsnGT1蛋白与相应CEs的互作关系,将报道载体(pCAM-Wr/Wm/Gr/Gm) 和效应载体(pROKII-W70/MYB/GT1/NAM)共转移到烟草叶片中,GUS/LUC相对活性实验表明:在盐胁迫条件下PsnWRKY70可特异性结合W-box,而PsnMYB、PsnGT1、PsnNAM可特异性结合GT1元素。   2.PsnWRKY70基因序列分析和表达分析 PsnWRKY70的ORF长度为966bp,编码321个氨基酸的蛋白质。单WRKY域和Cx7Cx23HxC-type锌指状模体表明PsnWRKY70 TF是Group III成员。PsnWRKY70蛋白化学式可能的是C1553H2405N445O513S16,理论pI 为5.72,分子量为36.03 kDa。亚细胞定位显示PsnWRKY70存在于细胞核的可能性最大。多序列比对结果显示PsnWRKY70与拟南芥和粳稻的Group III WRKY TFs一致(图1)。系统发育分析结果表明PsnWRKY70和胡杨WRKY70具有高同源性(XP_011001689.1)(图2)。qRT-PCR 检测PsnWRKY70在小黑杨不同组织种表达水平不同,在叶中高表达,根和茎中低表达,因此选择叶片作为材料进行后续实验。 图1多重序列比对(红盒框内序列为保守WRKY域,蓝框内氨基酸残基为锌指模体。) 图2系统发育分析:来自不同物种的WRKY蛋白质系统发育树,红色标识的蛋白质为PsnWRKY70 TF 3.PsnWRKY70 转基因植株的培育和验证 为进一步研究PsnWRKY70 基因在不同胁迫中的生物学功能,通过转基因实验,构建小黑杨PsnWRKY70基因过表达和抑制表达的转基因植株,并在转基因和NT植株中进行了胁迫响应分析。得到了8个OEX植株和10个REX植株并通过gDNA PCR、Northern blot、基因表达水平结果进行了验证。 4.转基因植株和NT植株的盐胁迫和叶枯病胁迫响应 数据显示在正常生长条件下REX植株(REX1-REX3)一般都比OEX(OEX1-OEX3)和NT植株高(表1和2)。 在盐胁迫下,REX植株的RHGRs明显大于NT和OEX。此外,在所有盐胁迫处理的植株中,REX1有最大的RHGR(0.296±0.008),而OEX2是最小的RHGR(0.199±0.011)(表1)。在病菌胁迫下,REX往往比NT和OEX生长慢。OEX3的RHGR最大(0.264±0.019)REX1的RHGR最小(0.154±0.012)。(表2)。 表1盐胁迫下的OEX、REX和NT植株的HG 表2叶枯病胁迫下OEX、REX和NT植株的HG 叶盐损伤指数表明,OEX比NT和REX损伤更大。而叶病指数表明,REX比NT和OEX叶疾病症状更严重。此外,REX2叶盐害指数最小(52.06%±1.34%),OEX2叶枯病指数最小(27.30%±1.50%)(图3a-d)。 图3...

Genome-Wide Analysis Reveals Extensive Changes in LncRNAs during Skeletal Muscle Development in Hu Sheep 湖羊骨骼肌发育过程中全基因组范围LncRNAs的显著变化   杂志: genes  影响因子:3.600 PMID: 28763026       研究背景: 羊肉具有蛋白含量高、脂肪和胆固醇含量低等优点,促进羊的肌肉生长可提高羊肉产量。过去关于羊骨骼肌生长的研究主要集中在蛋白质编码基因,然而基因组绝大部分是非编码序列。长非编码RNA(lncRNAs)是一种重要的非编码RNA,越来越多研究发现某些功能型的lncRNAs是新的肌肉调节元件,发挥重要作用。关于羊肌肉相关lncRNA的转录组学研究较少,尤其关于湖羊的研究更少, lncRNA在羊骨骼肌生长过程中的表达类型和潜在作用大部分都是未知的,因此了解羊不同生长时期肌肉转录组的动态变化具有重要意义。 本文拟研究湖羊三个关键生长阶段(110天胎儿期,5天幼年期,2岁成年期)肌肉lncRNA的表达模式和潜在作用,筛选差异表达lncRNA的和DEGs(差异表达基因)的靶基因。同时通过lncRNA-gene网络预测湖羊肌肉生长的lncRNA潜在调控因子,获得湖羊肌纤维生长相关的转录水平的候选调节因子。 材料和方法 材料:相同的自然光环境下饲养的胎儿期、幼年期、成年期湖羊,每个时期选取3个随机样本,取既定部位(12和13胸椎之间)的LD肌肉样本,采样后即刻液氮冷冻提取RNA。 测序平台:Illumina platform 分析平台:百迈客云平台(BMKCloud),分析内容如下: 在百迈客云平台上,对胎儿期、幼年期、成年期湖羊肌肉细胞进行RNA-seq测序后转录组拼接。进行注释后,先排除<200个核苷酸或单外显子的转录子,再用CPC,CNCI,PFAM,CPAT等工具从未知转录组中筛选候选lncRNA。四种方法FPKM>0.1的转录子交集定义为lncRNA转录子。 应用DEGseq packages (1.10.1) 来分析组间的表达差异,FDR值<5%,log2(倍数变化)的绝对值被定义为差异化表达。 预测差异表达的lncRNA的顺式靶基因和反式靶基因。 为分析lncRNA的主要功能,通过NCBI的Nr、GO、KEGG、COG数据库比对进行靶基因和DEGs注释,KS≤0.05,信号通路矫正p值≤0.05的GO term被定义为显著富集的。 为进一步研究lncRNA和他们的靶基因的相互作用,建立LncRNA-Gene共表达网络。 结果: 1.测序拼接和转录组分析 胎儿期、幼年期、成年期3组RNA-seq序列质控后,经过去接头、多聚尾、低质量序列后,每组平均获得了65578070,65591958,71241551的拼接序列,9个文库平均GC含量为54.39%,每个样本Q30值≥91.71%, 92%以上与O. aries参考基因组特异性匹配,分析显示胎儿期有45.1%的序列与外显子区域匹配,后期阶段匹配度更高(幼年期53.8%、成年期53.7%),在幼年、成年期组的内含子和基因间序列比例低于胎儿期。(表1) 表1.矫正后序列与不同阶段湖羊参考基因组比对 2.lncRNA筛选和特征性描述 为研究湖羊肌肉lncRNA的基本特征,筛选lncRNA并与mRNA比对。CPC、CNCI、PFKM、CPAT交集部分有6924个lncRNA转录子,包括已知的保守lncRNA,肌肉分化相关的lncMD(图1A) 图1 A 韦恩图  图1B. lncRNA和mRNA在每个染色体上的分布比例。红色和黑色线条分布代表lncRNA和mRNA,蓝色线条代表相应染色体在基因组中的大小比例 lncRNA转录子分为4606个lincRNA(66.5%),1131个内含子lncRNA(16.3%),1187个反义lncRNA(17.1%)。与mRNA类似,lncRNA转录子在26对染色体和X染色体中分布广泛,但线粒体中不存在。而且lncRNA在几个染色体中的比例与染色体大小比例一致,尤其是18号染色体,表明在此研究中相应lncRNA可能体现重要功能(图1B) 比较lncRNA和mRNA的外显子特征,结果显示大部分lncRNA每个转录子包含2-5个外显子(均值3.3),比mRNA少(均值7.9,图1C) 图1C 湖羊lncRNA每个转录子外显子数      图1D 湖羊lncRNA外显子大小分布 另外大部分lncRNA包含2个外显子,而包含2个外显子的mRNA仅占比3.9%,明显低于lncRNA。lncRNA中外显子平均长度相对长于mRNA,大部分小于200bp(图1D)。与蛋白编码基因一致,在肌肉生长过程中同一阶段lncRNA表达趋势相似,且平均表达水平比与蛋白编码基因低(图2A,B) 每组重复间的相关性分析显示相关性高(图3A-C),而且在6924个表达的lncRNA转录子中,于某一生长阶段特异性表达的占比33.03%,这个比例在蛋白编码基因中较低(4%),提示lncRNA的特殊意义和动态特性。胎儿期特异性lncRNA为1042个,远高于幼年期(626)和成年期(619),表明lncRNA在早期发展阶段的重要意义。 图2A胎儿期、幼年期、成年期湖羊肌肉lncRNA的FPKM分布 图2B胎儿期、幼年期、成年期湖羊肌肉蛋白编码基因的FPKM分布 图3 每组重复间的相关系数分析(A胎儿期组,B幼年期组,C成年期组) 3.差异表达分析及靶点基因预测 3个时期两两比较分析显示在胎儿期vs幼年期、幼年期vs成年期、胎儿期vs成年期(对照组vs实验组),分别有27、14、92个lncRNA,239 270 1437个基因是特异性表达的。(|log2FC| > 1, FDR < 0.05).值得一提的是,幼年期vs成年期组差异表达的lncRNA量最低,在胎儿期vs幼年期组和幼年期vs成年期组,DEGs的数量几乎一样多,表明产前和产后尽管在时间只相差1一个月,但是转录水平的差异较大(图4A-D)。 图4 对比组差异表达lncRNA和基因的数量(A 不同对比组差异表达lncRNA数量的韦恩图 B 不同对比组DEGs数量的韦恩图C不同对比组差异表达lncRNA总数 D不同对比组DEGs总数) 差异表达的lncRNA中,在胎儿期vs幼年期有36个上调lncRNA,42个下调lncRNA,幼年期vs成年期有13个上调lncRNA,28个下调lncRNA,胎儿期vs成年期有68个上调lncRNA,78个下调lncRNA。DEGs中,胎儿期vs幼年期组有1028个上调基因和487个下调基因、幼年期vs成年期组有659个上调基因和900个下调基因、胎儿期vs成年期有1862个上调基因和1749个下调基因。差异表达的lncRNA和DEGs的分层集群显示幼年期和成年期的表达模式相似而与胎儿期有所差异(图4E,F)。 图4 E 差异表达的lncRNA的分层集群  F DEGs的分层集群 为进一步评估RNA测序的结果,选择MYOG(从胎儿期富集的与晚期肌肉细胞分化相关的基因),MYH7(肌肉结构基因),5种差异表达的lncRNA,4种DEGs进行qRT-PCR分析。表达量与RNA-Seq结果一致。结果表明表达与测序结果有较好相关性,表明测序结果可行度高。 lncRNA可以通过与靶基因顺式和反式作用发挥功能,通过两两对比分析,预测相邻上下游100kb的和或差异表达lncRNA的互补蛋白编码基因。得到共201个靶基因。 图5 qRT-PCR和RNA-Seq分别验证不同时期湖羊肌肉差异表达lncRNA和基因的表达水平 4.差异表达的lncRNA和mRNA靶基因的生信分析 为进一步研究差异表达的lncRNA,通过与NR / GO/...

通过全基因组Bisulfite测序技术研究羊卵巢DNA甲基化与生产力之间的关系 杂志:BMC Genomics 影响因子:3.729 PMID:28969601   背景 DNA甲基化是一种表观遗传学的调控机制,在生物学调控过程中起着重要的作用,比如基因表达、基因印记、细胞分化和胚胎发生以及决定生物的表型和可塑性。甲基化发生在胞嘧啶残基的CpG核苷酸上。目前,哺乳动物中,通过高通量测序进行全基因组甲基化探索重要的生物学功能的技术被广泛应用。对农户而言,羊的生产效率以及产仔次数是重要的经济回报指标。通常情况下,生殖性状的遗传性在中等及以下,并且对表型选择的效果并不显著。因此,研究生殖能力相关的基因信息可以提高选择效率。繁殖能力由卵巢滤泡调控,该过程被精确的增殖和分化事件调控。近期的研究主要集中在DNA甲基化如何调控卵巢的形成和生殖系统发育上。一些证据表明,卵巢的发育受DNA甲基化的调控。通过对猪的卵巢甲基化分析发现,在猪的性别和卵巢发育成熟过程中存在甲基化的改变。在山羊下丘脑甲基化研究中也存在类似的结果。尽管有这些发现,但是想弄清楚DNA甲基化模式与生产力之间的关系仍然有局限。湖羊被公认为生殖系统成熟早且生产能力强,然而,最近几年的研究中,更多的注意力集中在肉质上,选择过程中关注生殖特征的研究相对较少。繁殖是一个复杂的过程,例如产仔数量这一特征受许多微效基因和一些主要基因的影响。所以了解DNA甲基化在基因功能中的作用非常必要。该研究中选用WGBS的技术对湖羊甲基化进行研究,系统的分析了DNA甲基化模式与产仔数量的潜在关系。另外,此项研究也可以增加对湖羊甲基化的认知和了解。 材料和方法 实验材料:共选取6只湖羊(Hu sheep ),年龄3岁,非妊娠母羊,分为两组: HP组(高生产力组):3只湖羊,有3次产仔记录(n=3,litter size=3) LP组(低生产力组):3只湖羊,有1次产仔记录(n=3,litter size=1) 分别将处于发情期的母羊在12小时内进行屠杀,收集身体同侧的卵巢,迅速用液氮冷冻, -80 °C储存,分别提取DNA和RNA,DNA进行bisulfite处理。 测序平台:北京百迈客生物科技有限公司 IlluminaHiSeq 2500平台,两组分别选取3个样本进行WGBS测序,两组总RNA进行转录组测序 分析平台:所有数据在百迈客云平台(BMKCloud)进行分析,分析内容如下: 1.参考基因组比对 测序片段在进行甲基化分析之前需要与参考基因组比对,通过bisulfite处理和PCR扩增将未甲基化的胞嘧啶(C)转换成胸腺嘧啶(T)。应用Bismark 软件将bisulfite处理的片段与参考基因组(Oar_v3.1)比对,其他数值均选用百迈客云平台的默认参数。用该软件进行测序深度和覆盖度的统计,以及bisulfite转化率统计,甲基化类型确定。Bismark 软件不能辨别单个胞嘧啶位点,参数设置为coverage ≥ 4×,FDR< 0.05。 2.评估甲基化水平以及鉴定DMRs 使用MOABS软件对覆盖度大于10X的胞嘧啶位点进行DMRs(差异甲基化区域)分析,运用如下公式: 3.DMGs(差异甲基化基因)生物信息分析 将DMGs与GO,COG,KEGG数据库进行比对分析这些基因的功能,进行GO富集分析,以及应用KOBAS软件对KEGG通路中显著富集的差异表达基因进行检测。并且利用String数据库对选取的DMGs进行互作网络分析。 结果 1.DNMTs表达水平 首先用qRT-PCR的方法分别对HP组和LP组卵巢中DNMTs(DNMT1, DNMT3A和 DNMT3B)表达水平进行了分析,发现HP组中DNMT1和 DNMT3A的表达水平显著低于LP组(P < 0.05)。 图1. HP组和LP组卵巢DNMTs的表达水平分析 2.DNA甲基化比对以及甲基化模式分析 HP组和LP组每个样平均产生的clean数据分别是63.59G和66.72G。比对率在71.36%-74.68%之间。平均每个组中胞嘧啶位点的甲基化率在3.5%左右。 表1.全基因甲基化测序结果 该研究中发现了3种甲基化的模式:CG,CHG(H 表示 A,C或 T), 和 CHH,这些类型在HP和LP两个组的比例是非常相似的。HP组中:89.78% CG, 2.46% CHG, 7.76% CHH;LP组中:88.60% CG,2.66% CHG,8.74% CHH。 图2.甲基化模式分析 3.甲基化序列偏好性分析 通过小提琴作图分析,图中不同的点代表不同的甲基化水平,且通过横截面积可以看出CG甲基化类型的数量较多,而CHG和CHH甲基化类型的数量较低。通过各样本染色体甲基化图谱的分析发现,染色体中大多数超甲基化胞嘧啶是CG类型的,并且不同组中染色体上的胞嘧啶甲基化位点有差异,如18号染色体。另外,研究者还分析了sequence context和甲基化偏好性之间的关系,统计了所有可能的9个碱基序列甲基化百分比,mC位点处于超甲基化状态中,CAG是CHG甲基化位点中绝大多数共同序列motif,并且两个组中CHH contexts的频率不一样。 图3.各样本甲基化分布小提琴图 4.不同功能区域DNA甲基化水平 研究者将所有的mC分为启动子、5 ’UTR、外显子、内含子、3 ’UTR这几个基因功能区域,通过这些功能区域对甲基化水平进行评估。两组中,各区域表现出相似的甲基化水平,并且CG类型的甲基化水平高于CHG和CHH类型。mC的大部分位点发生在内含子、外显子(第一个外显子除外)及下游区域。此外,在第一个外显子中CG甲基化水平低于除上游区域以外的其他部分,上游区域的甲基化水平表现出下降的趋势,TSS(转录起始位点)附近的CG位点甲基化水平低于首个外显子区域的甲基化水平。另外,在外显子和内含子中检测到高度甲基化,并且这种甲基化水平从启动子区到TSS区逐渐下降,从TSS区到内含子去逐渐增加。CHH类型是低甲基化一类并且在各功能区域较稳定,CHG类型几乎未甲基化。 图4.CGI不同功能趋势图 5.CGI区域甲基化注释 CGI(CG岛)区域功能注释发现,约68%超甲基化CGI分布在基因间区,1.5%的超甲基化CGI分布在UTR区,在两个组中没有显著差异(P > 0.05)。 图5. 不同功能部分CGI甲基化分布比例 6.HP组和LP组DMRs分析 检测两组DMRs以及根据不同的甲基化类型进行基因功能注释。共鉴定了70,899个 CG 类型DMRs, 16 个CHG类型 DMRs以及356个 CHH 类型DMRs。大多数在基因间区,5 ’ UTR 和 3 ’ UTR分别只有33和162个DMRs。基于所有的甲基化类型,除基因间区外内含子中DMRs的比例最高。研究人员还对两组DMRs进行了热图聚类分析。 图6.不同基因功能区不同甲基化模式中DMRs比例 7.测序结果验证 为了验证测序结果,从测序结果中随机选取10个DMGs进行qRT-PCR实验,结果显示HP组中GPNMB,ELK4, BACH1, CDIPT表达水平显著低于LP组,而SCYL1表达水平显著高于LP组(P < 0.05),两组中 ABCG2,mTOR,STK3, ACVR1...

题目:mRNA-miRNA整合分析揭示BR、auxin信号通路参与调控油菜分蘖(分枝)角度 发表杂志:Int J Mol Sci  影响因子:3.226 研究背景 油菜是全球范围内非常重要的一种油料作物,随着人口的增加与可用耕地面积的减少,最大限度提高包括油菜在内的各类作物的产量成为了育种学家考虑的一个重要问题。增大单位土地上的种植密度是一种增加作物产量的策略,每棵植物生长所需的地上面积主要由侧枝的数量、长度与着枝角度决定,这些因素中,对侧枝及叶子着枝角度的研究对于植物的高密度种植策略的应用具有重要的意义。 在以往的研究中已经发现,水稻中的LAZY1,、TILLER ANGLE CONTROL1、PROSTRATE GROWTH1、 LOOSE PLANT ARCHITECTURE1基因,玉米中的ZmTAC1、ZmLAZY1基因,拟南芥中的 AtLAZY1 、 AtLPA1基因均参与调控了叶子或侧枝的着枝角度。在代谢物水平,通常认为叶或枝的着枝角度与植物生长素( auxin)、油菜内脂素(Brassinosteroids,BR)的在组织中的不均匀分布有关系。 在植物中,一些microRNA也被发现与auxin调控网络或者分蘖角度相关,比如,miR393通过auxin调控网络影响叶与根的形态结构;miR164可降解转录因子NAC1转录本,从而下调植物对auxin的响应水平,抑制植物侧根的发育;auxin响应基因ARF8、ARF6在大部分物种中被miRNA167调控;水稻中,过表达miR160,水稻分蘖角度增大。 目前,油菜中对分蘖角度的研究还比较少,本研究组之前基于F2群体,使用BSA混池性状座位定位策略,鉴定到了一个与auxin合成相关,且可能参与了侧枝着枝角度调控的基因BnaYUCCA6。 该研究通过对分枝角度有显著差异的两种油菜品系进行mRNA与microRNA高通量测序,来进一步探讨油菜中与分蘖角度相关的分子调控机制。   材料与方法 材料: 油菜品系6098B(较大分枝角度,约52度) 油菜品系Purler(较小分支角度,约22度) 方法: 测序类型:mRNA、microRNA高通量测序 测序平台:illumina Hiseq 2000测序平台 取样方法:两个品系的均取抽薹时期与花发育早期两个时间点的分枝发生部位。每个品系每个时期1个样本(每个个体至少取5个分枝发生部位,最多6个个体混样样本),总共4个样本,每个样本分别进行mRNA测序与microRNA测序 数据分析平台:百迈云数据分析平台(https://www.biocloud.net/) Figure 1 技术路线 结果:mRNA测序与分析 a)每个样本测序得到~6Gbase 可用数据,与参考基因组比对率~80%。 b)差异表达基因筛选(EBseq,FDR < 0.05 & |FC|>2):如图2A所示,抽薹期,两个品系间检测得到5908个差异表达基因;花发育早期,两个品系间检测到5397个差异表达基因。其中3261个为两个时间点共有差异表达基因。 c)对上述3261个共有差异表达基因进行GO功能分析,如图2B所示,差异基因在biological adhesion、biological phase、and locomotion、 macromolecular complex、cell junction、and nucleoid 、nuclear and protein binding transcription factor activity and receptor activity等GO term上有显著富集。 d)对两个时间点所有差异基因进行KEGG通路分析,其中3297个基因注释到了KEGG数据库 ,其中大多数基因注释到了 ribosome 、oxidative phosphorylation相关代谢通路。值得注意的是,在两个时间点分别有58、51个差异基因注释到了植物激素信号通路,进一步分析发现,这些通路大多为BR或auxin信号转导通路。该部分结果如图3所示。 Figure...

Biochemical and Comparative Transcriptomic Analyses Identify Candidate Genes Related to Variegation Formation in Paeonia rockii PMID: 28817092 杂志:Molecules 影响因子:2.861 研究背景:牡丹是木本灌木,芍药属牡丹组,是一种重要的传统观赏植物,花瓣大而有吸引力。在十个牡丹野生种中P. rockii(紫斑牡丹)白色花瓣的基部有明显的黑色彩斑,而P. ostii(凤丹)没有花瓣杂色。花的颜色是牡丹的一个重要的商业特性,花瓣颜色的多样性可提高牡丹的观赏价值,因此阐明P. rockii中紫斑的形成机制具有重要意义。众所周知,牡丹的基因很大组(13–16 GB),往往具有较高的杂合度和配子体自交不亲和性,在缺少完整的基因组序列的情况下,RNA测序技术是获得基因组表达信息最有效的工具。到目前为止,几个花青素生物合成相关基因在牡丹中已确定,但是色斑形成的分子机制还不清楚。 材料方法: 取P. rockii (PR),P. ostii (PO)和PR与PO的杂交F1代(RO),分别收集4月底到五月初5个不同开放阶段的三种牡丹的花瓣进行转录组分析,三个生物学重复。取阶段5(完全开放期)的花瓣进行形态解剖分析和色素含量分析。 技术路线: 实验结果: 花瓣颜色测量,形态解剖分析和色素含量分析 为了确定色斑性状的遗传背景,利用PO和PR杂交产生F1植株(RO),所有60株F1植株在花瓣的基部都有色斑存在(Figure 1),PR的彩斑呈显性遗传。根据英国皇家园艺学会比色卡(RHSCC),在阶段5的PR和RO的背景与PO花瓣一样为白色,而在第5阶段的PR和RO的色斑颜色有差异。PR色斑为深紫色,而RO的为紫红色。 Figure 1. Fully open flowers of individuals selected for sequencing. 为了阐明其色斑形成的机制,作者检测了色素在PR, PO和RO花瓣中的空间位置。在非色斑花瓣中没有色素细胞(Figure 2C,I,L)。相反,色素细胞主要位于色斑花瓣的上、下表皮和栅栏组织中(Figure 2F,O)。色素细胞在PR的杂色相应也位于表皮内(正面),这可能有助于PR色斑更深的颜色(图左)。在非杂色花瓣中,表皮细胞是无色的(图2A,B,G - K)。 Figure 2. Cellular features of the flower materials. HPLC分析表明,在P. rockii和F1代牡丹花瓣的色素中含有四种花青素(CY3G5G,CY3G,芍药色素(Pn)3G5G和Pn3G)。PR的色斑显示出“Cy > Pn”的表型,CY3G是含量最高的花青素(28.36 ±...

小RNA和降解组联合测序揭示microRNA调节茶叶(Camellia sinensis)中儿茶素生物合成 Combined small RNA and degradome sequencing reveals complex microRNA regulation of catechin biosynthesis in tea (Camellia sinensis)   杂志:PLOS ONE 影响因子:2.806 PMID: 28225779   研究背景 MicroRNAs是一种内源性非编码小RNA,在动植物转录后调控及其他生物学过程中有至关重要的作用。基于碱基互补配对机制,miRNAs主要通过直接切割目标mRNA和抑制目标基因转录这两种方式调节目标基因的表达。前期研究表明,miRNA参与多种植物的生长和发育过程,如:根、叶、花的形态发生,信号转导,激素反应和营养代谢等。植物miRNAs主要通过克隆、生物信息预测、高通量测序和Northern 杂交的方法来检测。最常用的技术是高通量测序,不仅经济实惠,而且在低丰度的情况下可以更简单、快速获得大量miRNAs。植物中miRNA主要是通过切割目标基因或者抑制目标基因的表达进行调控,所以目标基因的确定对miRNA功能的分析至关重要。miRNAs目标基因的预测可以通过生物信息的方法,目标基因的鉴定主要通过降解组测序和5’-RLM-RACE方法(RNA连接酶介导的5'cDNA末端的快速扩增),这两种方式还能鉴定miRNA目标基因切割位点,有助于miRNA功能分析。 茶树(Camellia sinensis),富含儿茶素,是风靡全球的非酒精饮料之一。儿茶素是茶叶中重要的组成部分,包括脂型儿茶素(如:ECG和EGCG)和非脂型儿茶素(如:EC和EGC)。EGCG是茶叶中含量最丰富的儿茶素并且具有较强的抗癌效果,可以制约癌细胞的生长,抑制雄激素受体的功能并调控癌细胞的生存,血管的生成和移动。基于他们的分子构成,儿茶素可以分为简单儿茶素和脂型儿茶素。在儿茶素的合成过程中有许多酶的参与,如查耳酮合酶(CHS),查尔酮异构酶(CHI),黄烷酮醇4-还原酶(DFR),花青素合酶(ANS),花青素还原酶(ANR)和类黄酮3,5羟基化酶(F3’5’H)。MiRNA被鉴定为转录和转录后水平基因表达的重要调节因子,并且裂解目标mRNA是植物中基因表达的主要调控方式。 在茶树中,虽然通过高通量测序和芯片技术发现了许多保守的以及新的miRNAs,但是miRNAs直接调控儿茶素生物合成还没有明确的定义。此项研究中,研究人员通过高通量测序鉴定茶叶中保守的以及新的miRNAs,再通过5’-RLM-RACE方法分析潜在的目标miRNAs。通过表达模式分析进一步筛选儿茶素积累过程中潜在的miRNAs。结合5’-RLM-RACE实验和表达模式分析,研究人员发现了一些新的调节儿茶素生物合成途径中基因切割的调控因子。 材料和方法 实验材料 茶树1005,取叶片(包括芽,第一叶,第二叶,第三叶,第四叶,第五叶,成熟叶),进行混合,提取总RNA。 茶树1005,取叶片(包括第一叶,第三叶,成熟叶),进行qRT-PCR表达分析和儿茶素含量测定。 测序平台:Illumina HiSeq 2500 (Biomarker Technology Co.) 技术路线 实验结果 1.茶叶中miRNA的初步分析 从提取的总RNA中构建smallRNA文库,测序质控后得到19,567,691条clean reads,与数据库比对发现有18.83%的rRNA,1.23%的tRNA,0.01%的small nuclear RNA,0.07%的重复序列,其中79.85%的序列没有功能注释,可以将这些没有功能注释的序列用来做下一步的miRNA的预测和鉴定。根据smallRNA的测序长度分布图可以得出,miRNA的长的主要分布在20-25nt之间,丰度最高的是24nt(47.89%)。这个长度分布和其他栽培茶以及其他植物报道的结果非常相似。 2.茶叶中保守miRNAs的鉴定 将没有功能注释的clean reads与miRBase(植物已知保守miRNA数据库)进行比对,共获得69个保守的miRNAs,分别属于62个家族。根据长度分布发现,这些保守的miRNAs的长度主要集中在18-25nt之间,长度主要集中在24nt(46.385),其次是21nt。 对高通量测序的miRNA片段进行分析,鉴定的保守miRNA中,read values低于1000的占91.3%的比例,其中read values低于10的占56.52%的比例。研究人员还发现了一些高表达(read values大于1000)的miRNA家族,如miR165a和miR396a。另外,在不同家族中的miRNAs表达量差异较大,并且在同一家族中各miRNAs之间的表达量也有较大差异。这些数据表明,不同家族miRNA的表达模式不同,意味着不同的miRNAs在茶树生长发育过程中的作用不一样。 3.茶叶中新miRNAs的鉴定 通过miRDeep2和Mfold软件分析,共鉴定出47个新的miRNAs,进一步对这些新miRNA进行片段长度和表达量分析。新miRNA跟保守miRNA长度分布相似,主要集中在18-25nt之间,最集中的长度是24nt和21nt。另外,新miRNA的表达量比保守miRNA的低,新miRNA中表达量最高的只有4517个read values。   研究人员将这些新的miRNA与其他植物中已知的miRNA进行比对,揭示了许多同系物。除了三个miRNA归为同一个家族外,绝大多数的miRNA可以被分为独立的家族。研究者还对新miRNA的前体进行了分析,发现他们都有一个发卡环结构,长度在84-114bp。 4.GO功能富集和KEGG通路分析目标miRNA 为了研究茶树miRNA的功能,研究人员运用TargetFinder软件和转录序列对上述miRNA进行目标基因预测。结果显示,其中97个miRNA对644个目标基因有调控作用。再将644个目标基因进行GO和KEGG通路富集分析:GO富集分析发现这些目标基因主要富集在细胞、细胞器、细胞膜、连接活性、转运活性、新陈代谢和细胞进程等功能条目;KEGG通路富集发现366个目标基因参与36个代谢网络相关,主要参与糖酵解、柠檬酸循环、氨基酸代谢、光合作用、脂肪酸代谢、嘌呤嘧啶代谢、氧化磷酸化、植物病原体相互作用、初级代谢产物和次级代谢产物过程。 miRNA靶向基因降解组测序和功能分析 为了进一步预测和鉴定miRNA靶向基因,研究团队构建了降解组文库并进行深度测序,结合转录组数据和上述获得的miRNAs,通过TargetFinder软件预测到216个靶向基因被97个miRNAs调控。在这些靶向基因中,降解组测序鉴定了26个基因的26个切割位点,被16个miRNA家族的19个miRNAs进行转录后调控,如表1。 表1.通过降解组测序鉴定茶树1005中miRNA靶向基因 基于5’-RLM-RACE技术对目标断裂位点的验证 研究人员采用5’-RLM-RACE的方法,对其中5个有注释的miRNA(来自降解组测序)切割位点进行验证。结果显示,目标基因comp152929被csn-miR396a1 和 csn-miR396a2共同调控,切割位点在目标基因的第11-12个核苷酸处;两个基因comp159882和comp157894同时被miRNA167a调控,且有共同的切割位点,在目标基因的第11-12个核苷酸处;另外,miRNA394a调控comp156493,切割位点有两处,分别为第10-11,17-18个核苷酸处;同样的,novel-miR2调控comp145093,切割位点也有两处,分别为第10-11,12-13个核苷酸处。5’-RLM-RACE的实验验证了这些降解组分析的结果,另外一些切割位点有待进一步的验证。 7.茶叶中miRNA的表达模式分析 对茶树1005叶片儿茶素含量的研究发现,儿茶素在不同叶片中的的含量由高到低排序为:第一叶,芽,第二叶,第三叶,成熟叶。第一叶,第三叶和成熟叶的儿茶素含量有显著差异。 为了探索茶叶中miRNAs与儿茶素合成相关性,研究人员采用qRT-PCR的方法分析第一叶、第三叶以及成熟叶中miRNA(read values高于平均值)表达。通过表达模式的成簇分析将这些miRNA分成三组。第一组,miRNA表达模式与儿茶素含量成正相关,分别有novel-miR10, novel-miR13, novel-miR19, csn-miR165a, csn-miR170, csn-miR2593e 和novel-miR12;第二组,miRNA表达模式与儿茶素含量成负相关,分别有novel-miR1, novel-miR2, csn-miR160a, csn-miR162a, csn-miR394 和csn-miR396a;第三组,miRNA表达模式与儿茶素含量没有显著相关性,有csn-miR4380a。 8.调控儿茶素生物合成基因miRNA的鉴定 为了深入了解miRNA在调控儿茶素合成代谢中的功能,研究人员将高通量测序获得的miRNA跟NCBI数据库以及RNA测序的儿茶素生物合成相关基因的mRNA进行BLAST,预测可能的miRNA。为了消除假阳性,对预测的断裂位点进行实验验证。通过5’-RLM-RACE实验验证了6个可能参与儿茶素生物合成功能基因表达调控的miRNA。它们分别是csn-miRNA167a、f...