植物研究百迈客云解决方案-BMKCloud_数据库收录的棉花数据所涉及研究方向

解决方案概述

 

针对植物基因组学研究,百迈客云可通过BMKCloud_数据库模块向用户提供海量的植物高通量测序公共数据,借助公共数据,可大幅降低研究成本,提升研究层次。数据检索、下载、保存均在图形化界面下完成,避免了传统模式中,须在命令行界面下进行数据下载、格式转换等一系列繁琐操作的限制,完全适用于国内生信0基础的用户。

对于公共数据的下游分析,百迈客云目前已实现公共数据模块与分析模块的无缝对接,用户可直接将已保存至用户目录的数据直接导入BMKCloud_APP分析模块进行下游分析,该模块同样采用图形化操作界面,无需用户掌握任何编程基础,高度集成化专业化的分析流程可保证用户快速完成对数据的基础分析以及必要的数据深度挖掘。

 

BMKCloud_数据库目前收录数据9PB,覆盖约1100个属,常见作物数据收录情况见下图:

 

整合公共数据库中棉属RNA-seq数据,进行转录本重构(有参)并鉴定其中lncRNA,用于后续的棉纤维发育相关lncRNA分析

 

BMKCloud_数据库收录的棉花数据所涉及研究方向:

 

发育调控类:玉米产量 叶发育 根发育 胚乳发育 胚芽发育 花药发育 子房发育 组织发育 光合作用 杂种优势……

非生物胁迫类:干旱胁迫 淹水胁迫 寒冷胁迫 热胁迫 盐胁迫 低磷胁迫 氮胁迫 甘露醇胁迫 机械损伤应答 蔗糖处理胚乳 种子中Zn积累 ……

生物胁迫类/免疫互作类:轮状镰刀霉菌侵染 禾谷镰刀菌侵染 立枯丝核菌侵染 水稻黑条矮缩病毒侵染 蠕孢菌侵染 虫害应答 玉米叶斑病 吸胀冷害 ……

其他:ncRNA鉴定 转录因子鉴定 基因组组装 标记开发 遗传进化 杂种优势 线粒体功能研究 表观遗传……

 

文章思路

Wang M et al.  Long noncoding RNAs and their proposed functions in fibre development of cotton (Gossypium spp.).  New Phytol. 2015

 

 

1. 棉属转录本组装数据准备

 

1)海岛棉叶、根、茎、花瓣、花药、柱头、开花期0天棉铃、开花后10天棉铃、开花后20天棉铃共9个样本的自测转录组数据

2)搜集SRA数据库中,棉属转录组数据,共搜集得到154个来源于illumina平台的棉属转录组数据。BMKCloud公共数据模块数据搜集过程:进入平台公共数据模块,输入关键词“Gossypium”,并按SRA项目编号进行检索,使用数据类型“transcriptome”进行过滤,最终得到104个项目数据,可根据数据来源平台在进行进一步手动过滤,最后一键保存数据至用户账号用于后续分析

 

2. 运行lncRNA_APP鉴定lncRNA

 

1)进入BMKCloud APP界面,选择lncRNA分析 平台,打开任务投递界面

2)分别从用户目录中导入棉属转录组数据

3)选择文库类型

4)选择海岛棉参考基因组v1.0

5)选择差异表达分析相关参数

6)任务提交运行

 

 

3. lncRNA _APP运行结果

 

 

4. lncRNA表达量特征分析

 

 

5. 棉纤维发育相关lncRNA分析(棉纤维起始相关)

 

1)随机挑选20个倾向在海岛棉棉铃中高表达的lncRNA,通过RT-PCR观察它们分别在lint纤维fuzz纤维均正常发育陆地棉野生株(TM-1、Xuzhou142、YZ1)、lint纤维fuzz纤维均缺失陆地棉突变株(XZ142WX、XinWX)、lint纤维正常发育fuzz纤维缺失陆地棉突变株(n2、GZnn、GZNn)的转录水平

2)结果发现,编号为LINC02在开花期0天左右转录水平在lint纤维正常发育株中显著高于lint纤维缺失株;在开花期5天左右转录水平fuzz纤维正常发育株中显著高于fuzz纤维缺失株;而上述两个时间点分别为两种棉纤维起始(initiation)时间点,因此,文章认为编号为LINC02的lncRNA与棉纤维的initiation有关

 

 

6. 棉纤维发育相关lncRNA分析(棉纤维延伸、次级细胞壁生成阶段相关)

 

1)为了鉴定与棉纤维“伸长”、“次级细胞壁生成”阶段相关的lncRNA,对lncRNA组装阶段得到开花期10天与开花期20天的棉属lincRNA(720个)与mRNA(6858个)进行WGCNA分析,该分析可调用BMKCloud平台小工具WGCNA来完成。

2)WGCNA分析共将上述基因划分为17个模块,其中模块16与模块12分别表现为D亚基因组、A亚基因组偏倚表达,模块16也在oxidation -reduction生物途径上有显著 富集,这一途径一般认为与棉纤维的发育相关。

 

7. 棉纤维发育相关lncRNA分析(联合miRNA数据分析)

 

1)下载海岛棉纤维起始、伸长、次级细胞壁生成3个阶段7个样本的小RNA测序公共数据,数据SRA数据库项目编号PRJNA284336。

2)使用上述公共数据鉴定海岛棉中的microRNA及各自的前体序列。该步骤可将在BMKCloud平台目录下保存的PRJNA284336项目数据直接导入BMKCloud 小RNA分析平台 完成。

3)通过对小RNA前体序列与lncRNA序列进行同源比对,根据比对结果判断lncRNA来源的microRNA,该步利用部署于BMKCloud平台的BLAST小工具完成。

4)其中lncRNA来源的microRNA miR397,其靶基因LAC在木质素合成过程中发挥了重要的作用,而一般认为,microRNA的来源lncRNA对其合成有负调控作用,因此认为miRNA397的来源lncRNA参与了棉纤维的发育过程。

 

立即体验