大鼠发育过程中11种不同器官非编码基因的表达谱分析和功能注释

PMID: 27934932

杂志:Scientific reports

影响因子:5.228

 

研究背景:目前蛋白编码基因的功能已有了比较广泛的研究,但对非编码RNA(ncRNAs)功能的了解还非常少,先前ncRNAs被简单视为转录过程中内含子和基因间区积累的碎片。近期的研究发现,ncRNAs可能在很多生物、病理和发育过程中发挥关键的作用,比如它们可以调节mRNA的翻译,对细胞行为起决定性作用。但是到目前为止,我们对大部分ncRNAs的确切功能,甚至他们的表达谱还知之甚少。ENCODE计划在人lncRNA和小鼠组织特异性元件的鉴定方面取得了很大进展,但是很少有研究报道lncRNA在小鼠的脑、心脏和肝脏发育中的作用。此外,以往的研究表明非编码基因比编码基因对器官和年龄因素有更高的敏感性。因此,对大鼠不同发育阶段中不同器官的非编码基因的全面鉴定和注释就显得非常重要。

公共原始数据获取:

从GEO数据库中下载得到Ying等人上传的原始测序数据(GSE53960)。数据集中包含来自32只大鼠的320个bodymap样本(每只大鼠包含肾上腺、脑、心脏,肾、肝、肺、骨骼肌、脾脏、胸腺、睾丸或子宫10种不同器官)的转录组测序数据。Ying等选取了2周、6周、21周和104周四个时间点,每个时间点处死雌、雄两只大鼠,进行四次生物学重复。

技术路线:

实验结果:

1.大鼠非编码基因表达谱

为了获得大鼠非编码基因表达谱的概览,作者首先提取了FPKM>0.01 的3,458个非编码基因的表达值,其中54.8%(1,895)是假基因、33.5%(1,158)是miRNA、6.8% (237)是lncRNA(Fig.1a)。分层聚类分析显示,非编码基因的表达谱明显按器官类型聚类,比编码基因表现出更高的器官特异性。PVCA分析发现在数据集中方差贡献率最多高的是器官(62.94%)(Fig.1b)。在非编码基因表达谱的总体方差中年龄(2.82%)贡献率超过了性别(0.13%)贡献率(Fig.1d)。

 

Figure 1. Expression profiling of noncoding genes

 2.年龄和性别相关非编码基因的差异表达分析

 利用Cuffdiff对非编码基因在基因和转录水平进行了分析。统计结果发现,除肾上腺和心脏外雄性大鼠比雌性大鼠共享更多的发育阶段依赖性DEnGs。所有组织中DEnGs的数目从19(雌性大鼠脑)到503(睾丸)不等(Fig.2a)。肾上腺、心、肾、肝、肌肉和胸腺表现出相当数量的发育阶段依赖性DEnGs,脑和肺中DEnGs的数量最少。

性别相关的DEnGs不仅取决于器官,还与年龄相关。脾脏中性别相关的DEnGs数量最多的,而肺中最少,在所有发育阶段中肾上腺和胸腺显示相当一致的DEnGs数量。在幼鼠的大多数器官中性别特异性非编码基因大量表达,而青春期的大鼠性别特异性的非编码基因表达较少。幼鼠大脑中性别相关DEnGs的数量最多,这可能与发育早期大脑快速的发育速度有关(Fig.2b)。

 

Figure 2. Identification of differentially expressed noncoding genes

 3.脑和睾丸中有大量非编码基因表达

 当比较不同器官对时,DEnGs的数量有了很大的变化。四个发育阶段中脑和肝脏与其他器官相比时获得了相对较多的DEnGs。睾丸和胸腺中DEnGs的数量表现出明显的年龄依赖性。与其他器官相比,第6和21周的大鼠睾丸中存在最大数量的DEnGs(Fig. 2c)。

4.共表达网络的构建

为了注释大鼠非编码基因功能,作者构建了蛋白编码基因和非编码基因之间的共表达网络,包含3572个与年龄相关的蛋白质编码和非编码基因,1603性别相关基因,和16346个器官相关的基因。并通过GO分析检测共表达分析模块是否富集在特定的生物学过程中。

5.年龄相关的基因共表达模块与细胞分裂、细胞周期和免疫系统发育有关

在与年龄相关的基因共表达网络中,发现了包含3572个基因的14个稳定模块(Fig. 3c)。蓝色的模块包含1151个基因(其中有60个非编码基因)被显著富集到诸如细胞周期过程,细胞分裂,有丝分裂,以及转录调节和RNA代谢调节GO条目中。这些条目富集结果说明发育差异与生长发育过程中的代谢变化和基因表达调控有关。通路分析显示细胞周期和碱基切除修复相关基因被显著富集,提示细胞周期和自我修复功能可能受老化影响。其他模块如棕色和绿色显示出另一个免疫系统相关的富集趋势,如免疫反应、免疫系统发育和淋巴器官发育。很多脑、脾脏和胸腺中的年龄相关基因与癌症和其他年龄相关疾病关联,这提示衰老可能是通过影响免疫系统导致这些疾病的发生。其他基因主要涉及帮助免疫系统抵御炎症和转移白细胞以建立机体的防御系统。最后,粉红色模块中的七个非编码基因与骨骼系统的发育有关。

 

Figure 3. Co-expression network construction on age-related genes.

本文还利用相同的方法构建了器官相关和性别相关基因的共表达网络,结果显示器官相关模块很大程度上取决于不同组织类型的功能,性别相关模块中包含性别发育相关基因。

6.年龄相关棕色模块的可视化分析显示枢纽编码基因在网络中的调节作用

作者通过关联3,572个年龄相关基因中的特征向量基因研究模块和年龄之间的关系(Fig.4a),毗邻关系反应模块的相关性。包含许多非编码基因的棕色模块与年龄有相对紧密的关系。因此选取了此模块中189个与衰老相关的基因(包括七个非编码基因,阈值为0.32)进行进一步的网络可视化分析,获得了两个主要的集群,其中有几个中心基因连接着相邻基因。虽然非编码基因不在网络的中心,但是七个大鼠的非编码基因与免疫系统相关基因共同参与网络运作。

 

Figure 4. Network visualization of age-related brown module.

结论:利用大鼠bodymap RNA-seq数据构建了大鼠4个发育阶段、11个组织中的3,458个非编码基因的表达谱。构建了一个推断蛋白质非编码基因生物学功能的编码和非编码基因共表达网络,年龄相关模块被富集到免疫系统发育相关条目。年龄相关棕色模块的可视化分析发现大鼠非编码基因与免疫系统相关基因共同参与网络运作。

创新点:本文提供了一个鉴定和注释大鼠非编码基因的模型,涉及到多个器官和雌雄两性的不同发育阶段。建立了一个全面、可靠的推断多个器官之间随发育变化的非编码基因表达平台,为以后大鼠中非编码基因表达谱研究奠定了基础。