真核生物无参考基因组的转录组分析平台

以新一代高通量转录组测序(RNA-Seq)数据作为输入,从头(de novo)组装转录本,构建转录组(Unigene库),并对Unigene进行功能鉴定,以及结构和表达量分析。 测序数据质量评估;转录组组装,转录本和Unigene组装长度统计;Unigene结构分析,包括CDS预测、SSR鉴定和SNP分析;Unigene功能注释分析;Unigene差异表达分析及差异表达Unigene的功能注释和富集分析。测序数据量为6Gb的6个植物样品分析耗时约7天。

转录组是连接基因组遗传信息与生物功能的蛋白质组的纽带,转录水平的调控是最重要也是目前研究最广泛的生物体调控方式。转录组测序能够对样品任意时间点或任意条件下的转录组进行测序,拥有精确到单个核苷酸的分辨率。能够动态反映基因转录水平,同时鉴定和定量稀有转录本和正常转录本,并且提供样品特异的转录本序列结构信息。

目前转录组测序技术已广泛应用于农学、医学等各个研究领域,包括动植物发育调控、环境适应、免疫互作、基因定位、物种遗传进化及肿瘤与遗传病检测等。

真核生物无参考基因组的转录组分析平台可以进行标准分析和个性化分析,其中标准分析包括:转录本拼接、差异表达基因分析、基因结构分析等。设定参数后点击提交进行分析,分析完成后在流程定制页面下生成标准化结题报告,实现一键式生成。

真核生物无参考基因组的转录组分析平台的分析流程以BMK自主研发的程序对测序数据进行质量评估为开始,包括数据量、数据质量Q30等的评估。

做完数据质量评估之后,使用软件Trinity将测序Reads拼接成转录本序列。Trinity[1]不依赖于参考基因组序列,从头进行全长转录本的拼接,是目前业界公认的最好的RNA-Seq从头(de novo)组装软件。拼接完转录组,提取出每个基因最长的转录本序列构建Unigene库。

使用软件Bowtie[2]或BLAT[3]进行Reads与转录本或Unigene的比对,基于比对结果使用软件RSEM[4]等计算转录本和Unigene的表达量。同时,使用TransDecoder或Getorf、MISA、SOAPsnp[5]或GATK[6]进行Unigene的结构分析,包括CDS预测、SSR预测、SNP位点的识别,并通过软件BLAST[7]和HMMER[8]将Unigene与各数据库进行序列比对,获取Unigene注释信息。

接着根据Unigene在不同样品中的表达水平,使用软件DESeq[9]或EBSeq[10]进行差异表达分析,并通过指标FDR和FC筛选差异表达基因。

最后,提取各差异表达基因集的注释信息,使用Fisher精确检验、topGO[11]等进行差异表达基因集的GO节点或KEGG通路富集分析。

案例解析

Transcriptome sequencing and metabolite analysis revealsthe role of delphinidin metabolism in flower colour in grapehyacinth.

研究背景

葡萄风信子因其特殊的蓝色花成为重要的观赏植物,不同品种植物花色主要有花中代谢组分决定。有研究发现蓝色花的渐变主要由飞燕草素决定,而红色花则由花青素决定.

实验设计

本文以蓝色花和白色花风信子为研究对象,基于百迈客IlluminaHiSeq 2000测序平台,分别获得2G和2.7G Clean Data。

信息分析

真核生物无参考基因组的转录组分析平台将测序数据进行Trinity拼接得到89,926条Unigenes,平均长度633bp。Unigenes进行功能注释,共143条Unigenes与色素沉淀相关,其中>80%注释到有花青素合成相关。通过差异基因与代谢组联合分析,得出类黄铜物合成与翠雀花素代谢公用关键酶,在白色花中类黄酮大量积累,导致白话翠雀花素减少,花色呈现白色,最终揭示了风信子不同花色形成机制。