公共数据整合分析场景篇-大豆公共数据应用案例

大豆研究套餐: 整个多个大豆RNA-seq公共数据,分析SWEET基因家族在大豆生殖组织与营养组织间表达变化规律

文章思路

Patil G.  et al. Soybean (Glycine max) SWEET gene family: insights through comparative genomics, transcriptome profiling and whole genome re-sequence analysis. BMC Genomics. 2015

1. 大豆中SWEET基因鉴定

SWEET基因家族在植物体内的糖运输、免疫及生殖组织发育过程中发挥着非常重要的作用。研究者使用拟南芥、水稻中的SWEET家族基因序列,通过BLAST比对,鉴定到了大豆中的52个SWEET基因。 该步骤可非常方便的调用部署于百迈客云平台上的BLAST小工具来完成。

2. 大豆中SWEET基因与其它物种的序列比较分析

为了了解不同物种中SWEET家族基因的进化关系,研究者对大豆中的SWEET家族基因与其他13个物种(包括水稻、拟南芥、玉米在内)中的SWEET基因构建系统进化树。 该步骤可调用部署于百迈客云的MEGA小工具来完成。

3. 大豆中SWEET基因上游调控转录因子分析

研究者提取了52个转录因子的启动子序列,预测了这些启动子序列中存在的motif序列,并在转录因子数据库中注释到了可与上述motif序列结合的转录因子,这些数据为之后研究SWEET基因转录调控网络提供了数据基础。 该步骤中的motif序列提取可调用部署于百迈客云的motif_prediction小工具来完成。

百迈客云motif_prediction小工具运行结果

4. 大豆中SWEET基因不同组织中表达量变化规律分析

1)下载大豆RNA-seq公共数据集: 数据集1 SRA数据库编号:PRJNA140081. 包含14个样本,其中11个样本为生殖组织来 源(花、豆荚、种子),3个为营养组织来源(叶、根、根瘤) 数据集2 GEO数据库编号: GSE29163. 包含10个样本,其中6个样本为生殖组织来源(花、花芽、种子),4个样本为营养组织来源(根、茎、叶、幼苗) 该步骤可进入BMKCloud_数据库模块按数据编号完成数据检索及一键保存,保存后的数据可直接调用百迈云平台的分析模块BMKCloud_APP进行后续分析。

2)对大豆所有基因进行转录了水平定量,并从中筛选SWEET基因家族,分析该家族基因在大豆的生殖组织与营养组织见的表达量变化规律。 该步骤可直接将上步保存于百迈客云的公共数据导入BMKCloud_APP模块中的 “有参转录组分析平台”进行分析,运行后便可得到文章所需的结果。

分析结果:

1)GmSWEET21、GmSWEET24在所有样本中均高表达

2)有23个SWEET基因在所有样本转录水平非常低或者未检测到,这些基因或许为假基因,或者需要再特殊组织特殊时期表达

3)其余的SWEET基因均在花或者种子等生殖相关组织中高表达,说明SWEET基因在生殖相关组织发育过程中发挥重要作用,与之前的相关的研究结论一致。


立即体验