一作投稿综述│:空间转录组学:呼吸研究的最新进展和见解(什么是空间转录组学)
编译:微科盟 痞老板,编辑:微科盟 景行、江舜尧。
微科盟原创微文,欢迎转发转载,转载请注明来源于《转录组》公众号。
需要原文可私信获取!
导读
呼吸系统复杂的细胞异质性给该领域的研究人员带来了独特的挑战。尽管bulk RNA测序和单细胞RNA测序(scRNA-seq)为呼吸系统中的细胞类型和异质性提供了见解,但相关的特异性空间定位和细胞相互作用尚未明确阐明。空间转录组学(ST)填补了这一空白,并在呼吸研究中得到了广泛应用。本文综述了近年来ST的最新迭代技术,总结了ST如何应用于呼吸系统的生理和病理过程,重点是肺部。最后,作者提出了当前的挑战和潜在的发展方向,包括高通量全长转录组、多组学整合、时空组学、生物信息学分析等。这些观点有望推动包括呼吸系统研究在内的系统机制研究。
论文ID
原名:Spatial transcriptomics: recent developments and insights in respiratory research
译名:空间转录组学:呼吸研究的最新进展和见解
期刊:Military Medical Research
IF:21.1
发表时间:2023年8月
通讯作者:赵祥伟,王周光
通讯作者单位:东南大学生物科学与医学工程学院,温州医科大学药学院瓯江实验室
DOI号:10.1186/s40779-023-00471-x
主要内容
1 前言
呼吸系统由呼吸道和肺部组成,是与外部环境直接接触的器官之一。其结构和功能的复杂性阻碍了人们对其生理和病理过程的理解。大多数常见呼吸道疾病的发病机制非常复杂,是影响公众健康的一个重大问题。肺癌是临床上最常见的疾病之一,其发病率和死亡率在所有类型的肿瘤中排名第一。肺部肿瘤微环境的复杂景观是导致其误诊的主要因素。慢性呼吸道疾病,如哮喘、肺气肿和支气管炎,目前仍然根据呼吸道症状、医学成像和肺功能检测来诊断,但它们具有高度的异质性,并且经常重叠。这种对潜在疾病机制的模糊描述导致了非特异性的治疗方案,最终可能会减缓这些疾病的治疗效果。此外,肺结核和肺炎给患者的家庭和社会带来了巨大的经济负担。因此,揭示呼吸道疾病的发病机制,寻找特定的生物标志物和新的治疗靶点是改进现有诊断和治疗的重要策略。
转录组学是结合高通量测序和生物信息学来探索生物学机制的重大进步。然而,bulk测序分析掩盖了单个细胞的表型和功能差异,无法确定单细胞分辨率的分子特征。随着单细胞RNA测序(scRNA-seq)的发展,越来越多的细胞类型和亚型被检测和阐明,从而可以定义肺部的多种细胞类型和相关分子特征,为研究呼吸系统提供了有价值的工具。然而,由于单细胞测序中细胞解离导致的空间信息丢失,无法在肺部解剖中描述相邻细胞的相互作用和功能变化。此外,细胞状态和不同细胞位置之间的关系也应该被清楚阐明。
自2016年提出以来,空间转录组学(ST)为破译生理和病理基础提供了一个新的视角。在保持原始空间背景的同时,定量转录组分析允许产生的基因表达特征与细胞空间定位、生理学和组织学相关联。此外,ST研究可以揭示亚细胞RNA的分布模式,以帮助理解空间标记和调节的生物学过程。随着ST样本采集和处理技术的发展,试剂和测序成本的同时降低,以及计算平台的日益强大,解决基本生物学问题的潜力正在稳步扩大。对ST的一些相关应用已经被综述。然而,与脑神经科学、胚胎发育和心脏等器官组织相比,ST在呼吸和肺部疾病的研究中很少被回顾。
本文综述了近年来最新的ST迭代技术,并总结了这些技术在肺发育、肺图谱、肺癌和肺损伤等呼吸系统生理病理过程中的应用。最后,提出了目前面临的挑战和潜在的发展方向,包括高通量全长转录组、多组学和时空组学整合、生物信息学分析等。本文将以全面的疾病覆盖、深入的疾病机制探索、强调空间异质性和未来发展方向为重点,为ST在呼吸系统疾病中的应用领域做出独特而有价值的贡献。
2 ST的发展和局限性
空间转录组方法发展迅速,根据检测策略可分为基于成像的方法和基于测序的方法。以前的综述已经详细阐述了ST的原理和分类。本文主要关注这些技术的创新形式和变体。
2.1 基于成像的ST策略
基于图像的ST技术包括基于荧光原位杂交(ISH)和基于原位测序(ISS)的方法。高分辨率显微镜和单分子荧光原位杂交(smFISH)技术的出现,使得原位亚细胞分辨率转录本的量化成为可能。一个独特的荧光标记探针结合RNA,允许单个分子的定位,该技术的变体RNAscope已商品化,并且多轮杂交、成像和探针解剖等策略已被广泛应用,如sequential FISH(seqFISH)(图1a)。基于等温扩增的杂交链式反应(HCR)也已被应用于解决高自发荧光的问题,即smHCR(图1b)。为了克服探针杂交错误和读取错误,已经开发了一种条形码分配方案,即多路错误鲁棒FISH(MERFISH),并广泛用于组织水平的单细胞转录定位和ST(图1c)。在此基础上,序列荧光原位杂交(seq-FISH )、ouroboros smFISH(osmFISH)和交换反应信号放大(SABER)被提出来解决成像过程中的分子拥挤问题。其中,seq-FISH 使用20个探针和3种激发光来分析10000个基因(图1d)。增强型电FISH(EEL-FISH)结合了电泳辅助大组织RNA采样和多重FISH,用于厚组织的转录成像,减少了数据收集时间。最近,扩增FISH(exFISH)和扩增辅助迭代荧光原位杂交(EASI-FISH)被用于使用水凝胶扩增的组织中基因表达的三维(3D)分辨率。总的来说,由于杂交技术的昂贵和耗时以及额外的挑战,如组织中的背景荧光,迄今为止,基于ISH的方法仅限于细胞和组织培养的研究。
图1.基于成像的ST策略。a)seqFISH通过顺序染色/成像循环在空间中解码转录物。b)与seqFISH相比,smHCR可以实现约20倍信号放大,原位检测单个信使核糖核酸。c)MERFISH使用组合FISH标记和纠正错误的条形码方案实现了数千个RNA成像。d)seqFISH 在四轮条形码中使用20个探针进行原位RNA成像。e)通过连接测序的ISS方法(ISS,IISS)。f)Electro-seq将生物电子学与ISS相结合,实现电生理学和基因表达谱分析。g)非靶向测序,如FISSEQ和ExSeq,能够对整个转录组进行无偏见的覆盖测序。ST空间转录组学,FISH荧光原位杂交,seqFISH 序列FISH ,smHCR单分子杂交链式反应,MERFISH多重错误稳健FISH,原位杂交,ISS原位测序,IISS改进原位测序,FISSEQ荧光原位测序,Electro-seq原位电测序。
基于ISS的方法分为靶向和非靶向mRNA检测。ISS是最早的靶向原位测序技术之一(图1e),通过挂锁探针和滚圈扩增(RCA)产生信号,使256个RNA转录物能够在单轮杂交中表达,并以Cartana的形式商业化。然后,BOLORAMIS(连接在扩增的RNA上的条形码寡核苷酸,用于多重和平行原位分析)通过引入DNA连接酶SplintR连接酶解决了ISS检测效率低的问题。基于杂交的ISS(HybISS)允许条形码系统改善原位检测,并消除了ISS序列连接化学的局限性。BaristaSeq利用合成化学测序技术,通过多轮成像显示更高的信噪比,并对RCA产物进行特定检测。在2023年的预印本研究中,Tang等人提出了改进的ISS(IISS),利用2碱基编码策略开发了一种改进的组合探针锚定连接化学,用于条形码查询,提高了ISS的信号强度和特异性(图1e)。此外,最近的一项研究将电化学和ISS(Electro-seq)结合起来,将细胞电生理与单细胞水平的基因表达联系起来,并确定心肌细胞发育过程中基因表达谱的变化(图1f)。
另一方面,空间分辨转录扩增子读出图谱(STARmap)无需cDNA合成,使用SNAIL探针和通过动态退火和连接(SEDAL)减少误差的测序来识别基因标识符。通过结合水凝胶组织化学,它分析3D组织中的组织样本,而不是单个2D模式。今年,该团队进一步更新了STARmap,即STARmap PLUS,并在阿尔茨海默病小鼠模型中实现了转录组和蛋白质的联合检测。
荧光原位测序(FISSEQ)是非靶向测序中的一种代表性方法,可以实现对整个转录组的无偏转录。然而,其随机引物导致检测效率低,并涉及复杂的酶促反应(图1g)。相关试剂和仪器已生产并商业化。基于FISSEQ,非靶向扩增测序(ExSeq)将扩增显微镜与ISS相结合,使用扩增的水凝胶锚定RNA并生成光学条形码,并已用于果蝇胚胎和小鼠大脑的基因分析(图1f)。
2.2 基于测序的ST策略
与基于成像的方法相比,结合下一代测序(NGS)平台和空间信息显著提高了ST的通量和转录物的无偏检索。开发了一种基于激光捕获显微切割(LCM)和scRNA-seq的方法,以允许在显微镜下对转录组进行空间无偏分析,并对感兴趣区域(ROI)进行分类和测序(图2a)。此外,Tomo-seq、地理位置测序(Geo-seq)和proximID被开发用于检测少量细胞转录组的异质性和空间差异。目前,光学标记物已经取代了传统的物理解剖学,如NICHE-seq、体内转录组分析(TIVA)、ZipSeq(图2b),它们使用照明模式和光笼寡核苷酸来标记ROI;GeoMx数字空间图谱利用可切割的寡核苷酸标签来量化ROI中RNA或蛋白质的丰度。一种名为Image-seq的技术允许使用具有高灵敏度和转录覆盖率的活体显微镜采集位置特异性活细胞进行测序,但缺点是降低产量(图2c)。
图2.基于测序的ST策略。a)LCM-seq集成LCM和scRNA-seq以实现区域测序。b)ZipSeq使用光激活标签来实现ROIs的标记、分离和scRNA-seq。c)Image-seq允许采集特定位置的活细胞,以便通过活体显微镜进行测序。d)Stereo-seq利用具有空间条形码的DNA纳米球进行转录空间定位。e)sci-Space使用空间条形码对组织切片中的细胞核进行成像、标记和转录组测序。f)基于illumina聚类和序列读取的Seq-Scope和Pixel-Seq。g)DBiT-seq利用微流体通道进行正交条形码,类似的技术包括xDBiT、CBSST-seq和Matrix-seq。hSTRS使用10×Visium全转录组分析平台。
鉴于成像和显微切割技术的低通量和捕获率问题,研究人员正在逐步考虑原位空间索引方法。研究人员开发了ST技术,利用空间条形码和唯一分子标识符(UMI)定位信使核糖核酸的位置信息和表达水平,并开发了10×Genomics(100μm),其捕获效率(10×Visium,55μm)已得到进一步改善。为了获得更高的分辨率,已经提出了利用随机条形码珠子的Slide-seq(10μm)和高分辨率ST(HDST,2μm)。Slide-seqV2(10μm)优化了文库构建和阵列索引,并在近细胞分辨率下证明了ST测序的高捕获效率。然而,低灵敏度和需要对珠子预解码限制了它们的应用。空间增强分辨率组学测序(Stereo-seq,0.22μm)使用以阵列模式沉积的随机条形码DNA纳米球来获得纳米级分辨率。它已被应用于构建器官发生的时空转录图谱(图2d)。sci-Space(200μm)和XYZeq(将空间元数据条形码到scRNA-seq库中的工作流程)(500μm)在大尺度上分析细胞和核的空间坐标。然而,它们不能提供实际的空间单细胞图谱,因为它们失去了细胞质转录信息(图2e)。Seq-Scope(0.5-0.8μm)直接使用illumina NGS芯片生成空间条形码阵列,实现空间条形码的亚细胞分辨率,用于可视化细胞核(图2f)。类似的illumina化学,多索引文库测序(Pixel-seq,1μm),通过图案条形码凝胶的可重复酶复制,成本降低了35倍,与现有方法相比,分辨率提高了200倍(图2f)。
基于微流体通道的方法也已集成并用于空间定位。用于空间组学测序的组织中的确定性条形码(DBiT-seq)(10μm)可以通过交叉条形码对组织进行空间编码,从而进行转录组和蛋白质分析(图2g)。受该方法的启发,组织中的多重确定性条形码(xDBiT)、用于空间转录组学测序的载玻片上的交叉扩增条形码(CBSST-seq)和Matrix-seq(一种基于微流体的条形码策略)也已被开发和应用,并扩展到空间多组学(SM-omics),如基于微流体索引的空间ATAC和RNA测序(MISAR-seq)和转录组和表位的空间共索引(spatial-CITE-seq)。此外,空间总RNA测序(STRS)利用10×Visium平台能够检测全谱RNA,而不仅仅是多腺苷酸化的RNA转录物(图2h)。基于空间索引方法的ST面临的一个更普遍的挑战是如何平衡mRNA捕获效率和横向扩散。此外,大规模的杂交逆转录可能导致基因表达的畸变。
3 ST在呼吸研究中的应用
由于研究人员对呼吸系统分子结构的极大兴趣,ST已广泛应用于肺发育和呼吸系统疾病机制的研究。本节总结了呼吸系统的新兴应用,如肺发育、肺图谱、肺癌和肺损伤(图3)。
图3.ST在呼吸系统研究中的应用。ST用于构建肺空间图谱和识别细胞组成。在肺癌中,ST揭示了肿瘤微环境、异质性、进化和转移以及肿瘤内微生物群起源的进一步定位。ST的其他应用还包括肺发育中的基因表达模式、肺纤维化的发病机制和COVID-19肺炎的发病机制。ST空间转录组学,COVID-19新型冠状病毒肺炎,NK cell自然杀伤细胞。
3.1 肺发育
Ljungberg等人使用空间原位杂交试图阐明出生前和出生后小鼠肺部的基因表达模式,以描述肺泡化关键阶段肺部发育的细节,并改进LungMap的数据。最近的一项研究应用原位杂交分析来确定人肺中克隆性间充质细胞的来源,特别是来自外膜成纤维细胞亚群的来源。间充质细胞的空间异质性及其潜在特征也已被描述。
3.2 肺的细胞组成和空间图谱
人类细胞图谱(HCA)旨在以单细胞分辨率建立健康个体不同器官和组织的图谱数据,包括专注于呼吸系统的人类细胞肺图谱(HCLA)。在呼吸系统研究中,细胞图谱识别了以前未定义的细胞类型及其表型和相互作用,增强了人们对呼吸系统和肺部疾病的理解。结合scRNA-seq,许多研究已经生成了健康和疾病的肺部分子细胞图谱,如LungMAP、discovAIR等。研究人员使用基于液滴和平板的scRNA-seq定义了人类肺部58种不同的细胞类型和基因表达谱。然而,由于缺乏描述肺部解剖特征的极端细胞异质性所需的空间背景和分辨率,这些数据是不准确的。事实上,最近的一项研究使用ST来区分80种细胞类型和状态,包括11个在以前的肺图谱研究中没有注释的细胞群,并定义了腺体相关的免疫生态位。结合scRNA-seq的基因表达谱和完整组织切片上的空间分辨转录组学,Sountoulidis等人构建了人类肺早期发育的全面位置图,描述了导致肺细胞显著异质性的发育轨迹。人们认为,肺在mRNA水平上的空间多样性与蛋白质组有关,此外还与生理功能有关。此外,已经开发了几种原位杂交技术,如邻近连接原位杂交技术(PLISH)和SCRINSHOT,并用于鉴定和定位小鼠的肺和气道细胞类型,包括最近发现的肺离子细胞。在远端气道和肺泡中,15种标记物被证明用于识别巨噬细胞和上皮细胞,如AT1和AT2细胞、支气管外分泌细胞和神经内分泌细胞。
3.3 肺癌
在过去的几个世纪里,肿瘤被认为是一个高度组织化的“器官”,而不是异常增殖细胞的简单聚集。癌症是肿瘤疾病死亡的主要原因。医学研究的一个重大挑战是在肺部病变开始和发展时确定正常的细胞轨迹点,并分析治疗后的细胞反应。
3.3.1 肺癌微环境
免疫检查点(ICP)靶向治疗在癌症中取得了相当大的成功,包括非小细胞癌症(NSCLC)、肺腺癌(LUAD)、鳞状和非鳞状癌。然而,研究表明,接受靶向药物治疗的患者的阳性反应率仍然很低,可能存在众多免疫相关不良事件。此外,原发性肿瘤对ICP靶向药物的耐药性往往阻碍了临床发展。越来越多的证据表明,肿瘤微环境(TME)与肿瘤的发展、转移和复发密切相关,在免疫逃避方面比ICPs更重要。因此,迫切需要提高对TME的认识,更好地对患者进行分类,并确定新的治疗靶点,以改善预后。肺肿瘤中TME的不同细胞转录组可以以单细胞分辨率检出,其表型和协同行为已被描述。空间转录分析可以揭示基质细胞在肺TME中的空间分布偏好。例如,在肺癌小鼠模型中,使用10×Chromium和原位成像来探索Tgfbr2缺失导致的TME重塑和促进免疫排斥。肿瘤相关巨噬细胞(Tumor-associated macrophages,TAMs)是TME中最丰富的免疫细胞之一,是抗肿瘤免疫的重要调节因子。然而,调控它们在TME中的丰度的机制仍有待探索。Larroquette等人分析了接受ICP阻断剂治疗的晚期非小细胞肺癌患者的预处理肿瘤样本,报告称TAMs中肿瘤区室的富集与免疫疗法耐药性有关。使用NanoString GeoMx对来自16个肿瘤标本的78个原位转录本进行空间分析。结果表明,TAMs在NSCLC中的预后作用与肿瘤细胞的距离直接相关,在TAM高水平浸润的肿瘤中,CD27、CCL5和ITGAM三个显著上调的基因可能是免疫治疗的潜在靶点。此外,应用多重免疫组织化学(mIHC)和数字空间分析器(DSP)对免疫检查点抑制剂(ICI)治疗后的非小细胞肺癌患者样本进行了TME分析。
3.3.2 肺癌异质性
许多基于scRNA-seq的研究揭示了癌症细胞的异质性。随着空间转录分析和scRNA-seq整合的进展,研究人员将特定的分子表型与未知的细胞相互作用模式或临床表现相结合,对肿瘤细胞亚群进行分类。例如,Sinjab等人确定了从正常组织区域到LUAD的空间位置进化的细胞谱系、状态和转录组特征,其中上皮细胞中CD24的显著表达驱动了原发性肿瘤特征。他们的数据提供了LUAD的空间图谱,以确定早期拦截的潜在目标。张等人使用Visium平台鉴定肺鳞状细胞癌(LUSC)中的空间位置特异性亚克隆。结果表明,肿瘤亚克隆的免疫细胞组成与肿瘤比例有显著差异,肿瘤纯度与肿瘤上皮-间质转化(EMT)的趋势相反。最近报道了高肿瘤内异质性(ITH)对晚期癌症治疗效果的影响。DSP的创新应用为通过整合基质区域的遗传信息来改善双特异性抗体治疗的治疗结果预测提供了令人信服的证据。
3.3.3 肺癌的发展和转移
癌症的发展涉及肿瘤细胞对环境的适应,是生命的必然和持续的结果。到目前为止,追踪人类癌症的进化主要集中在DNA突变上。然而,基因型不一定是表型,肿瘤内的癌症细胞群通常表现出显著差异和转录多样性。在这一方面,肺癌表现出更复杂的分子和形态学异质性以及亚克隆突变的不同组合,降低了癌症研究的可重复性,并对有效治疗提出了挑战。Zhu等人整合RNA-seq和ST技术,构建了LUAD的单细胞时空多组学图谱,以探索早期LUAD的动态进化轨迹。结果表明,LUAD可能起源于Clara和AT2细胞,最终进化为UBE2C 癌症细胞亚群,其中UBE2C介导肿瘤细胞的增殖和转移。随着LUAD从原位腺癌(AIS)发展为侵袭性腺癌(IAC),癌症细胞的空间分布可能比其类型更重要。这一发现弥补了scRNA-seq免疫分型LUAD缺乏空间信息的缺陷。此外,研究已经报道了基于DSP的NSCLC脑转移(BrMs)的机制。与原发性肿瘤相比,这些发现突出了与BrMs病变相关的高度免疫抑制微环境,其特征是B细胞和T细胞丰度降低,中性粒细胞浸润增加,为癌症BMS的空间异质性提供了一个框架,并确定了转移的特征基因以预测患者的预后。
3.3.4 瘤内微生物群
肺癌具有独特的微生物组成。几项研究表明,肿瘤中的细菌种群是肿瘤类型特异性的,可能直接调节癌症的发生和发展。Wong-Rolle等人从12名癌症患者中获得了空间宏转录组信息,以了解肺癌中微生物群的空间分布及其对宿主细胞异质性的影响,结果显示细菌显著集中在肿瘤细胞中,从正常组织和第三淋巴结构(TLS)到肿瘤细胞的含量增加,并在气道中达到峰值,表明癌症中的细菌可能来源于气道而不是肠道菌群。进一步的基因表达相关性分析显示,细菌含量与CTNNB、HIF1A和VEGFA基因呈正相关。此外,与肿瘤发生相关的几种信号通路也与癌症中的细菌含量呈正相关。作者相信空间转录组和局部相互作用组分析可以预测个体肿瘤行为,并为了解和逆转癌症进展提供有用的资源。
3.4 肺纤维化
肺纤维化是一种高度异质性的肺部终末期病理变化,其发病机制尚未完全阐明。首次发表的使用ST的肺纤维化研究聚焦于上皮细胞,证明了典型间质性肺炎/特发性肺纤维化(IPF)患者的上皮细胞/成纤维细胞病灶三明治样的独特分子特征。IPF的发病机制与上皮功能障碍有关。另一项研究使用GeoMx DSP平台来探索IPF病例中成纤维细胞灶与纤维和正常区域之间的转录差异,并确定了在成纤维细胞病灶中表达的新的成纤维生物标志物。时空分析为肺纤维化的研究发展带来了希望。例如,Shi等人探讨了二氧化硅吸入引起的继发性肺纤维化进展中异质性成纤维细胞的时空分布。结果表明,GREM1作为引起炎症的驱动因素,参与了这种肺部疾病的变化,可能是矽肺早期治疗的潜在靶点。
3.5 肺炎
由严重急性呼吸综合征冠状病毒2(SARS-CoV2)引发的2019冠状病毒(新冠肺炎)大流行已在全球范围内造成数百万例严重急性呼吸系统疾病,其发病机制尚不完全清楚,因此应更好地确定宿主对其感染的反应。ST为识别严重急性呼吸系统综合征冠状病毒2型感染后的细胞类型和阐明异质性提供了新的见解,如表1所示。布罗德研究所与哈佛医学院和其他机构合作,创建了感染后肺部空间转录组图谱,揭示了肺上皮、免疫和间质室的重塑,并绘制了与疾病严重程度相关的细胞类型和基因。对COVID-19感染患者的分析强调了导致患者死亡的疾病的两个阶段。Desai等人表明,RNA水平与疾病持续时间有关,报告了病毒载量和免疫反应的显著时空异质性。据估计,新冠肺炎感染将导致各种并发症和严重急性呼吸系统综合征冠状病毒2型(PASC)急性后遗症。Dinnon等构建小鼠模型,利用RNA-ISH和GeoMx DSP鉴定急慢性疾病分期的转录谱,为“长COVID”的检测和改进提供策略。此外,从SARS-CoV2和H1N1诱导的急性呼吸窘迫综合征(ARDS)患者的肺组织中获得的DSP数据显示出独特的转录特征,从而确定了新的治疗靶点。
表1.利用空间转录组学研究新冠肺炎的机制和并发症。
3.6 其他呼吸道疾病
原位测序和捕获技术已应用于结核病和流感感染的机制研究和治疗靶点发现。例如,有研究以感染H1N1的小鼠为模型研究ARDS,发现过度激活的成纤维细胞可产生细胞外基质重塑酶,从而促进免疫细胞的浸润,导致肺功能受损。许多研究使用scRNA-seq评估了其他呼吸系统疾病,如肺动脉高压、哮喘和慢性阻塞性肺疾病(COPD)。空间组学技术的引入有望加深对呼吸系统疾病的认识。
4 挑战与展望
尽管ST和相关的前沿生物信息学分析彻底改变了复杂器官和组织的研究,为发展系统和疾病机制带来了巨大的希望,但要发挥其潜力,还需要解决几个挑战(图4)。
图4.空间转录组学(ST)的挑战和前景。ST向高通量、全长转录组、活细胞体内分析方向发展,并将多组学和时空组学相结合,借助样品处理和生物信息学工具构建三维空间图谱,为探究组织结构和功能提供强大的新技术。
4.1 样本的准备和处理
预测序样本的稳定性和可用性可能是限制ST的主要障碍。任何含有mRNA的完整组织都适合空间转录组;然而,样品制备方案应根据不同组织的特点进一步优化。还应考虑组织类型之间的形态学差异。例如,单细胞/组织斑点会显著影响转录水平,皮肤细胞样本中的色素沉积会因光吸收而对图像采集产生负面影响。同样,具有肺泡囊的肺组织在冷冻时必须小心处理。此外,样本收集、储存和处理方法与原始转录数据存在测量偏差。一项研究探索了发育中的人类心脏的时空基因表达图谱。将心脏组织切碎,并使用胰蛋白酶和胶原酶在悬浮液中培养以产生单个细胞。一些研究应用外源性试剂进行分离;然而,他们几乎没有提到基于物理化学的分离和非自然处理是否会影响细胞的转录水平,从而降低生成的scRNA-seq数据的可靠性。关于空间转录组技术,基于原位捕获和测序的策略已经实现了无组织解剖测序,显著降低了样品制备的风险。然而,组织切片制备对转录组的影响也应从宏观角度考虑。因此,在样品制备方面需要进一步创新。理想情况下,用于测序的组织切片的上游处理是自动化的,使非专业人员可以操作。
越来越多的证据表明,ST可能有助于临床诊断、了解人类疾病和做出正确的药物决策。福尔马林固定石蜡包埋(FFPE)组织块是临床诊断中人体组织保存方法的金标准。空间转录组学的快速发展与FFPE块兼容,这是对样本库中超过10亿个FFPE切片进行深入病理分析的突破。不幸的是,样本中的RNA分子经常被严重降解;因此,迫切需要一个能够分析FFPE样本的平台。10×Genomics Visium和NanoString DSP已证明其与FFPE块的兼容性。Visium Cytasist于2022年底推出,由10×Genomics能够在30分钟内对组织切片进行自动转移分析,同时对一个FFPE样本进行转录组和蛋白质分析。然而,由于FFPE组织块通常储存在固定溶液中,并且从活检到固定的时间可能因样本而异,因此RNA的完整性也远低于新鲜冷冻组织。此外,由于数据的质量可能取决于特定样本,因此在临床应用之前,应提高其可靠性和稳健性。
4.2 高通量全长转录组
ST解决了scRNA-seq方法中由于细胞解离而丢失空间位置信息的问题。然而,除了空间寻址,这些方法的转录覆盖率和深度仍处于早期发展阶段。大多数ST方法只能检索单端转录物,而不能检索全长转录物。尚未检测到多聚腺苷化RNA分子的残差序列和非多聚腺苷化转录本的谱,这阻碍了免疫细胞受体谱和选择性剪接(AS)的研究。基于显微解剖的方法表现出理想的覆盖范围,但转录的通量和空间分辨率不理想,需要在组织切片的覆盖范围和转录本的检测灵敏度之间进行权衡。基于ISH的方法具有良好的空间分辨率和检测效率;然而,它们难以用于大组织切片和高通量。ISS具有高分辨率,但牺牲了转录捕获深度。最近,一种利用加A尾对单细胞进行大量转录组分析的方法被提出,即VASA-seq,这是目前唯一一种集高灵敏度、全长转录组覆盖和高通量于一体的单细胞测序技术。然而,VASA-seq无法获得细胞的空间位置信息。此外,高通量微流体与条形码索引的结合虽然提高了通量,但由于细胞固定和通透性处理,RNA的质量可能会下降。此外,还需要提高细胞/球的共包封效率。因此,更高的基因覆盖率、更低的检测偏差和更高的空间分辨率直至单细胞水平的技术备受期待。
4.3 3D空间图谱
目前,大多数先进的空间技术仅限于在2D模式上显示细胞组织和基因表达,而不是在实际的3D空间图谱上显示,这无法概括高度复杂的空间细胞环境。Tomo-seq在不同的组织切片上进行RNA-seq,以获得空间信息。类似地,Geo-seq与LCM技术相结合,研究具有空间位置的小样本的转录组。Peng等人用它构建了小鼠胚胎的3D转录组图谱,并准确地将单个外胚层细胞定位回其体内位置。然而,Geo-seq操作很复杂,需要连续的组织切片、LCM技术和数据库构建的测序过程。最近,NanoString的GeoMx DSP和STRP-seq已被开发用于结合生物信息学工具来重建3D结构图,如小鼠大脑和人类心脏。然而,这些技术受到空间分辨率和大样本量的限制。作者相信,高精度的3D结构重建和表征将进一步为临床应用和研究提供坚实的基础。
4.4 体内活细胞/组织
目前的ST方法不能应用于活细胞的体内组织学研究,因为它们只研究固定样本中某个时间的细胞快照。观察到的基因表达谱可能只是表达异质性的产物。这些技术将细胞限制在单个时间点的活性转录状态,而其他具有类似功能的细胞可能处于休眠状态。因此,他们在个体基因水平和时间尺度上正确推断细胞的能力仍然存在争议。一些研究小组试图在体外研究活细胞的转录组。例如,TIVA率先在活细胞中捕获mRNA进行转录分析。然而,这种方法目前不适用于许多细胞的分析。ZipSeq使用光笼寡核苷酸和特异性图案化照明在完整组织的活细胞上标记DNA编码(Zipcode),以探索其空间异质性。然而,它的低空间分辨率限制了它的应用范围。同样,Live-seq是第一个实现对活细胞中全基因表达的连续观察。然而,仍然存在一些问题,如在体内不适用和多次采样的局限性。因此,下一步的研究方向是如何推断未来或将过去的事件与当前的基因表达相关联,实现对活体细胞或组织中空间组学的探索,并在最小的细胞干扰下实时跟踪mRNA动态。
4.5 空间多组学和时空组学
ST在多组学数据和单细胞分辨率方面进展迅速。这一进展使得能够在单个实验装置内检索包括剪接变异、遗传和表观遗传学变化、蛋白质组学和时间维度数据在内的综合信息。这将有助于理解细胞-细胞相互作用和整体细胞表型/状态,以从多个空间尺度解决组织功能。如前所述,获得更全面的多组学图谱的最稳健策略是处理连续的组织切片,其中每个切片都由不同的组学分析。然而,连续的组织切片采样可能会导致样本异质性偏差。
研究人员在开发各种单细胞多组学技术方面取得了显著进展,如表2所示。此外,针对人类单细胞组学,已经专门设计了多个数据库,为数据分析和解释提供了全面的分析工具。在此基础上,空间多组学技术得到了发展,包括多组学单扫描综合组合分析(MOSAICA)、SM-omics、空间分子成像(SMI)、DBiT-seq和空间蛋白质和转录组测序(SPOTS),这些技术保留了空间信息坐标。开发新技术,如mIHC和飞行时间细胞术(CyTOF),也促进了与ST的联合分析。目前,空间多组学已列入《自然》杂志2022年的年度技术名单。尽管如此,空间多组学测序仍处于初级阶段。剪接变异体传统上很难在RNA水平上检测到,因为大多数技术都是基于单端转录分析。在蛋白质水平上,对靶向蛋白质的分析受到可用变体(如荧光染料、条形码或抗体)数量的限制,并且仅限于对靶向蛋白的分析。此外,组蛋白修饰、染色质可及性和代谢组学研究仍然缺乏空间对应物。综合方法需要高质量地获取多个参数,如基因覆盖率、通量、准确性和测序深度。最后,还应考虑如何实现实际的单细胞分辨率。
表2.单细胞多组学分析。
另一方面,生物系统中的基因表达是高度动态的,从时间和空间维度分析细胞相互作用和调节机制有助于理解复杂系统中的规则,即时空组学。在RNA-seq中引入RNA代谢标记策略,以区分新的mRNA和旧的mRNA,如4-硫代吡啶(4sU)和5-乙炔基尿苷(5-EU)。此外,RNA时间戳与RNA-seq结合,以小时为单位推断RNA的“年龄”。然而,这些方法仅适用于描述细胞的短时间尺度或时间点特征。因此,对同一细胞的连续分析和空间定位使时空组学成为可能,如“高通量Patch-seq”和“具有空间信息的Live-seq”。
4.6 生物信息学支持
在数据分析阶段,空间维度、数据量和复杂性的增加带来了巨大的挑战。用于scRNA-seq分析的许多生物信息学工具可以很容易地用于空间分析,包括去卷积、聚类、细胞类型注释和其他必要的处理步骤。然而,它忽略了空间位置和结构特征;因此,必须对现有的生物信息学计算管道进行改进,以分析ST的独特特性。Trendseek、SpatialDE、基于图拉普拉斯算子的综合单细胞空间分析(GLISS)和SpaGCN已被开发用于分析空间位置和基因表达之间的关系。研究细胞之间相互作用的方法包括基因图形卷积神经网络(GCNG)、空间方差分量分析(SVCA)、novaSpaRc和SpaOTsc。空间聚类使用stLearn、BayesSpace、使用基于经验贝叶斯的隐马尔可夫随机场的空间聚类(SC-MEB)和MULTILAYER等方法。预计空间组学技术的进步将导致分析计算工具的激增,促进不同平台之间的数据协调,并促进机器学习和图像分割等信息工具的整合。这种整合对于更深入地理解复杂的空间结构和将可用性扩展到广泛的可用数据源至关重要。
除了10×Visium,Stereo-seq和GeoMx DSP等商业平台外,上述大多数ST技术通常仅限于实验室。考虑到最近这些方法的发表以及将实验转化为诊断应用的高成本,这种限制是可以预料到的。标准化实验程序和数据分析管道有望促进空间组学分析技术的商业化和广泛可及性。此外,整合自动化样品处理、3D结构、深度切片扫描和时间数据的工作将通过揭示新的细胞结构和扩大人们对生物过程的理解进一步推进这一领域。鉴于ST的未来发展需要多学科的融合,生物信息学分析、自动化设备、临床转化研究和生物医学领域的研究人员之间的密切合作势在必行。
结论
本篇综述介绍了ST的前沿技术及其在器官/组织生理和病理过程中的应用。作为scRNA-seq的新迭代,ST的领域正在迅速扩展,显著提高了人们对发育生物学和发病机制的理解,并改变了诊断、理解和治疗疾病的能力。随着生物信息学、工程和SM组学的全面合作,作者希望在成本显著降低时获得有关全长转录组的高通量分子信息。这些数据将为阐明组织生态系统中细胞生物学机制之间的相互作用提供更全面的视角。