你的真实年龄竟藏在转录组中来自RAP
撰文
Enigma
#你的真实年龄竟藏在转录组中#
转录组数据经常会受到样本间不可控变动的影响,从而对分析造成干扰。这种变动通常是由于样本间发育阶段的意外差异造成的,转录组本身可以用来估计发育过程,但现有的方法需要大量样本,并且不能估计样本的真实年龄。
年7月11日,法国里昂第一大学的MirkoFrancesconi课题组在NatureMethods发表了题为RealagepredictionfromthetranscriptomewithRAPToR的研究论文,提出了以转录组不同时期作为参考的真实年龄预测(RAPToR)方法。该方法参考现有的时间序列数据,从其转录组精确估算样本的真实年龄。RAPToR对最常见的动物模型、人类甚至缺乏参考数据的非模型生物进行了全动物、解剖组织和单细胞数据的研究。作者发现,RAPToR可以用来消除年龄混淆的影响,并可在差异表达分析中重现感兴趣的信号。
基因表达的全基因组分析技术可提供了包括整个生物系统转录状态在内的全面和无偏见的视角。然而,基因表达数据的分析可能受到不可控和未知来源差异等影响而变得复杂。为了解决这个问题,已有几种方法问世以学习和删除数据中隐藏的协变量(或代理变量)。然而,这些方法的缺点是,差异的来源通常会比较模糊,因此可能会删除一些有趣的生物逻辑性变化。在生物复制或实验条件下的发育进程中,非预期的差异是发育系统中基因表达数据差异的主要来源,这可能会混淆或掩盖感兴趣的变量的影响。
估计样本真实生理年龄并识别它们之间隐藏的发育变化具有多种重要意义,首先是量化兴趣扰动对开发优化速度的影响,其次是区分发育引起的基因表达中扰动特异性变化和非特异性变化,最后是通过将推断年龄作为表达数据分析的协变量来揭示所研究扰动的时间特异性影响。在单细胞RNA测序技术出现后,从转录组中获取发育进展已成为近年来研究的热点。许多算法已经被开发出来,从大规模的批量、单细胞或者整个生物体转录组数据学习发育进程,并沿着该轨迹对样本进行排序。然而,这些算法的一个主要缺点是需要大量样本以直接从数据中学习发育表达变化的轨迹。它们只能输出数据特异性的排名或任意值(通常称为“伪时间”)而不是实际年龄的预测,这使得在不同数据集或条件下比较结果较为困难。
针对该问题,作者开发了一种计算框架,利用可用的时间序列基因表达数据作为阶段样本的参考,通过将参考数据与样本转录组的相关性最大的时间点作为年龄估计,从其转录组中确定单个样本的绝对年龄。考虑到该方法受限于参照的时间分辨率,作者在降维空间中对参考基因表达进行插值,在原始参考时间点任意时间间产生潜在的插值表达谱。样本年龄估值仅是插值参考和样本基因表达间的最大斯皮尔曼相关时间点,然后通过基因的自举来计算估计值的置信空间。该方案即通过RAPToR执行,简单说,RAPToR即一个提供插值引用和阶段样本函数的R包。
为了在最常用的动物模型生物中测试RAPToR,作者利用秀丽隐杆线虫蛔虫胚胎和幼虫发育、斑马鱼胚胎和幼虫发育、小鼠和果蝇胚胎发育的现有时间序列数据建立了插值参考,然后对秀丽隐杆线虫晚期幼虫发育和斑马鱼、小鼠和果蝇胚胎发育进行独立的时间序列实验,证实RAPToR能够估计个体的真实生理年龄,并揭示其发育速度的异质性。随后,作者提出RAPToR能正确地推断出不同环境下发育速度的比例因子。此外,他们建立了限制在衰老过程中具有稳定单调趋势的基因的RAPToR参考,对秀丽隐杆线虫、单虫样本、果蝇和人类的衰老进行了估测,发现RAPToR年龄估计可再现个体或环境条件之间生物年龄的真实差异,证实RAPToR可以从转录组数据可靠地推断衰老。
接下来,作者将RAPToR应用于解剖组织样本和单细胞数据的分析中,证明了在两者中的适用性。不仅如此,作者在多个线虫重组自交系(RILs)的表达数据(存在广泛基因变异)上测试了RAPToR的性能,发现RAPToR与之前轨迹学习方法的估计非常接近,从而证实了RILs从幼虫中期延伸到幼成虫阶段,这是一个在蠕虫的体细胞(蜕皮)和种系(精子发生和卵发生)中都有巨大表达变化的时期。这也证实了RAPToR在基因表达分析中对变异的鲁棒性。通过使用组织特异性基因集,RAPToR从整个生物体的表达中提供了准确的组织特异性年龄估计,而不受遗传背景的影响。在不同物种的测试中,得益于插值和对基因集变化的鲁棒性,RAPToR也给出了精确的年龄估算值。
综上,作者利用RAPToR技术成功地估计了发育和衰老过程中的年龄,包括从整个生物体数据估计组织特异性年龄,通过解剖组织和单细胞描述评估年龄,也可以实现通过使用一个物种作为参考估计另外一个物种的年龄。最后,作者展示了如何使用估算的年龄来量化对发育或衰老速度的影响,并恢复了感兴趣的相关变量对基因表达的特定影响,即使在完全被年龄混淆和掩盖的情况下。该方法并不局限于研究发育或衰老,原则上可以应用于具有可靠的内参基因表达动力学的任何过程(例如,细胞分化、细胞周期、疾病进展和药物反应)。
原文链接:
转载请注明:http://www.abuoumao.com/hykz/3338.html