NatGenet哺乳动物胚胎发生细胞
编译
王海云
审稿
苏延森
本文介绍由美国华盛顿大学基因组科学系的ChengxiangQiu和美国洛克菲勒大学JunyueCao等人共同发表在NatureGenetics的研究成果:作者着手整合几个与小鼠原肠胚形成和器官形成相关的单细胞RNA序列数据集。此外,作者定义了跨越E3.5到E13的19个连续阶段中每个阶段的细胞状态,试探性地将它们与其伪祖先和伪后代联系起来。尽管是通过自动化程序构建的,但由此产生的哺乳动物胚胎发生轨迹(TOME)在很大程度上与我们当代对哺乳动物发育的理解一致。作者还利用TOME指定转录因子(TF)和TF基序作为新细胞类型出现的每个分支点的关键调节因子。最后,为了便于脊椎动物之间的比较,作者对斑马鱼和青蛙胚胎发育相关的单细胞数据集应用相同的程序,并根据共享的调节器和转录状态指定“细胞类型同源物”。
1简介
发育生物学的一个基本目标是了解胚胎发生过程中细胞类型之间的关系,以及每种细胞类型出现的分子程序。原则上,可以全面描述发育程序,然而,秀丽隐杆线虫——体积小、半透明、发育不变性——仍然是唯一一种能够实现这种完整描述的模式生物。在过去四年中,包括作者在内的很多研究人员开发并应用了单细胞数据分析的新技术,以开发“全动物”规模的模式生物,包括蠕虫、苍蝇、斑马鱼、青蛙和小鼠,这些研究为后生动物发育的全球观点奠定了基础。
总的来说,这些研究跨越了小鼠胚胎从几十个少数类型的细胞(E3.5)发育为数百万个数百类型的细胞(E13.5)。然而,与这些研究相关的数据尚未进行系统整合。由于技术原因以及小鼠发育的复杂性,这些因素都为数据整合带来了挑战。
在这篇文章中,作者着手从E3.5到E13.5系统地重建哺乳动物胚胎发生的主要细胞轨迹。他们的策略受Briggs及其同事的启发,并做出了几个假设:1)尽管老鼠的发育是可变的,但关键模式在野生动物中是不变的;2)“Omniscellulaecellula”也适用于细胞状态,即在给定时间点观察到的细胞状态必须源于前一时间点出现的细胞状态;3)采样频率和深度足够高,新检测到的细胞状态不会产生于前一个时间点未检测到的先前细胞状态;4)如果时间增量足够小,转录相似性是连接相邻时间点观察到的相关细胞状态的有效手段。
值得注意的是,与Sulston的秀丽隐杆线虫开创性图谱不同,作者在这里侧重于重建细胞轨迹,这是一个与细胞谱系相关但绝不等同的概念。作者的目标是在小鼠发育过程中,为细胞类型的分子状态提供一个连续的、可导航的路线图。这样的路线图可能会限制组成细胞类型之间的潜在谱系关系,但没有明确规定它们。
2
结果
小鼠胚胎发生细胞轨迹的系统重建
文章使用的数据集来自跨越E3.5到E13.5的19个时间点或阶段的个样本。对于每个阶段,作者进行数据预处理,然后进行Louvain聚类和基于标记基因表达的单个聚类的手动注释。将“细胞状态”定义为给定阶段的注释集群,并且在19个时间点上确定了个细胞状态,每个时间点都收到了84个细胞类型注释中的一个。
对于每一对相邻的阶段,作者将细胞投射到一个共享的嵌入空间。为了解决数据批次效应带来的影响,在整合之前进行了基于锚定的批量校正。在联合嵌入中,采用了基于k-最近邻(k-NN)的启发式方法来连接相邻阶段之间的细胞状态。例如,对来自两个相邻时间点E6.25和E6.5的scRNA序列数据进行聚类和注释,分别确定了5种和6种细胞状态(图1a)。如果共同嵌入这些数据并遵循上述程序,将E6.5处的5个细胞状态与E6.25处具有相同注释的5个细胞状态紧密连接起来。E6.5处的新细胞状态与原始条纹相对应,与E6.25的外胚层紧密相连,作者将其划分为其伪祖先(图1a)。将此方法应用于E6.5→E6.75和E6.75→E7.0后,进一步将原始条纹归类为新生中胚层、前原始条纹和原始生殖细胞的伪祖先。
作者在18对相邻的时间点上都应用了这种方法,得到一个有个节点和条边的有向无环图,用于描述哺乳动物胚胎发生轨迹(TOME)的轨迹(图1c)。
图1小鼠胚胎发生细胞轨迹的系统重建
分子的系统发育轨迹能概括细胞的系统发育吗?
值得注意的是图1c(TOME)所示的图表并不反映细胞谱系,而是根据转录相似性推断的细胞状态之间的关系。关于“分子的系统发育轨迹是否能概括细胞的系统发育”这一问题,需要注意以下几点:
首先,胚胎外细胞状态和胚胎细胞状态之间没有边缘,不同胚层的胚胎细胞状态之间的边缘相对较少。在跨越生殖层之间的最强边缘“边界”中,有两条边缘连接E8.5神经嵴(PNS胶质细胞)和E9.5成骨细胞祖细胞的两个亚型,可能对应于成熟的神经嵴对骨的贡献;E8.5中间中胚层和E9.5肾上皮之间的另一条边缘,也是跨生殖层的既定贡献;以及E7.5-E8.0的尾侧外胚层和近轴中胚层之间的另一条边缘。
其次,80%的细胞类型在它们第一次出现时与一个单一的伪祖先紧密相关(边缘权重大于0.7)。这些强大的边缘通常尊重已建立的谱系关系,例如由下胚层产生的顶叶和内脏内皮层、由前原始条纹产生的脊索和最终内皮层、内脏中胚层产生的心肌细胞等。
第三,为一个细胞状态指定一个伪祖先。例如,血液内皮祖细胞经常被指定为E7.75-E8.25内皮细胞的假祖先。在其他情况下,明显的趋同可能反映了高度相关的细胞类型之间的不完全分离,而不是正在进行的分化(例如,脊索和最终内胚层之间的几个边缘;中胚层不同亚型之间的重复边缘)。然而,其他的情况反映了转录状态的真正收敛,即一个细胞类型有多个起源。
第四,给定细胞状态的真实谱系关系可以被在前一个时间点存在的高度相似的细胞状态所掩盖。值得注意的是,至少一些不准确性可以通过集中分析来通过区分新生和剪接转录本来解决,即RNA速度。
第五,对细胞状态的依赖,掩盖了发育生物学固有的连续性。例如,空间转录的异质性,通常表现为连续的梯度,被细胞类型或细胞状态的离散化所掩盖。在这里,作者通过不同的节点(例如前/中/后脑;近轴中胚层A/B/C),以有限的方式代表了空间异质性的各个方面,但这并不理想。
总之,分子轨迹通常概括了有充分记录的细胞系统发育,但也有明显的局限性。尽管如此,这张图在很大程度上与当代对哺乳动物发育的理解相一致,尽管它是通过自动化程序构建的。为了便于探索,作者创建了一个交互式网站,其中可以导航图1c中所示的节点和边。
对小鼠原肠形成过程中细胞状态的近似空间位置的推断
细胞间的空间关系是发育的一个关键,但在分析分解的细胞或细胞核时,这一信息丢失了。为了解决这一问题,一些研究小组开发了硅方法,将scRNA-seq数据与荧光原位杂交(FISH),或者将其他方法获得的空间分辨基因表达谱整合。在这里,作者试图利用Peng及其同事最近收集的数据,他们应用冷冻切片和批量RNA-seq(GEO-seq)来获得小鼠胚胎从E5.5到E7.5的精确区域的空间分辨转录组。受Peng等人估计E7.0GEO-seq区域内内胚层亚群区域化分析的启发,作者利用TOME来估计每个GEO-seq区域内单个细胞类型的丰度。对于许多细胞类型和区域,这种方法似乎效果很好。
推断单个细胞类型的分子历史
接下来,作者试图推断单个基因在每个细胞轨迹过程中的连续表达水平,重点
转载请注明:http://www.abuoumao.com/hykz/7874.html