【空间转录组测序】揭示生物组织内部基因表达的精确定位
在生命科学领域,理解基因如何在特定时间和空间内发挥作用,是揭示生物体功能、疾病发生发展机制的关键。传统基因表达分析方法,如体相RNA测序(Bulk RNA-seq),能够提供特定样本中基因的平均表达水平,但会丢失细胞的空间位置信息。单细胞RNA测序(scRNA-seq)则能解析单个细胞的基因表达图谱,但同样无法直观地呈现细胞在组织中的原始位置。正是在这样的背景下,空间转录组测序(Spatial Transcriptomics Sequencing)应运而生,它以革命性的方式,在保留组织空间结构的同时,对组织内所有或选定基因的表达进行高通量、高分辨率的分析,为我们理解复杂的生物过程打开了一扇新的大门。
什么是空间转录组测序?
空间转录组测序(Spatial Transcriptomics,简称ST)是一种创新性的基因表达分析技术,它通过整合组织病理学信息与高通量测序数据,实现在不破坏组织空间结构的前提下,解析组织切片上特定位置的基因表达谱。简而言之,它解决了“基因在哪里表达”这一核心问题。与传统的只提供“哪些基因表达”或“多少基因表达”的方法不同,空间转录组测序能够将基因表达数据精确地映射回其在组织中的原始物理位置,从而揭示细胞类型、细胞状态以及细胞间相互作用的空间异质性。
这种技术的核心价值在于:
- 保留空间信息:这是其区别于其他转录组学技术的根本特征。它允许研究者在三维组织结构中观察基因表达模式。
- 解析组织异质性:生物组织往往由多种细胞类型和微环境组成,ST能够识别并分析这些区域特异性的基因表达差异。
- 深入理解细胞微环境:通过分析特定区域的基因表达,可以推断细胞间的相互作用、信号通路以及局部微环境对细胞行为的影响。
空间转录组测序的核心技术原理
尽管有多种不同的空间转录组测序平台和技术路径,但其核心原理大致可归结为以下几个关键步骤:
- 组织切片与制备:将新鲜或冷冻的生物组织进行切片,并将其放置在预先设计好的、带有空间编码标签的载玻片或芯片上。
- mRNA捕获与反转录:组织中的mRNA被释放并扩散到载玻片表面,被带有空间条形码(spatial barcode)的寡核苷酸探针捕获。这些探针通常包含一个独特的空间位置信息、一个UMU(Unique Molecular Identifier)以及一个Poly(dT)序列,用于捕获mRNA的Poly(A)尾。随后进行反转录,将mRNA转化为cDNA。
- 文库构建与测序:含有空间条形码的cDNA被进一步扩增、打断、连接测序接头,构建成高通量测序文库。
- 数据分析与可视化:通过高通量测序获得海量的序列数据。这些数据经过比对、去重、定量后,根据其携带的空间条形码信息,将基因表达数据精确地映射回组织切片上的原始位置。最终,通过专门的生物信息学工具进行可视化,生成直观的基因表达空间分布图。
主要空间转录组测序技术平台与方法
近年来,随着技术的发展,涌现出多种各具特色的空间转录组测序平台,它们在空间分辨率、通量、可检测基因数量等方面有所不同,以适应不同的研究需求。
1. 基于捕获的平台(Capture-based)
这类平台通过在载玻片表面预先打印含有空间编码的捕获点,实现对组织切片上mRNA的捕获。代表性技术有:
- 10x Genomics Visium:
- 原理:载玻片表面均匀分布着数千个直径约55微米的捕获点,每个捕获点都包含数百万个带有相同空间条形码和UMU的寡核苷酸探针。组织切片放置在载玻片上,细胞裂解后mRNA扩散并被捕获,随后进行反转录、文库构建和测序。
- 特点:空间分辨率约为55-100微米(一个捕获点通常覆盖1-10个细胞),通量高,可对组织切片上所有基因进行无偏性检测。适用于识别组织区域异质性、肿瘤微环境等宏观空间模式。
- 应用:广泛用于肿瘤学、神经科学、发育生物学等领域。
- Visium HD (High Definition):
- 原理:Visium的升级版,通过将捕获点缩小并增加密度,将空间分辨率提升至2x2微米,甚至可达到单细胞分辨率。
- 特点:大幅提升了空间分辨率,能够更精细地解析细胞群体内的基因表达差异。
2. 基于成像的平台(Imaging-based)
这类技术通过高分辨率成像结合荧光原位杂交(FISH)或循环杂交等方式,直接在组织切片上对mRNA分子进行原位检测和定位,通常能够达到亚细胞或单细胞分辨率。
- MERFISH (Multiplexed Error-Robust FISH):
- 原理:通过多轮荧光杂交和成像,对数十到上千个预选基因的mRNA进行编码和识别。每个mRNA分子通过不同的荧光编码组合在空间中被唯一识别。
- 特点:单分子分辨率,高通量(可同时检测数千个基因),适用于精细解析细胞内基因表达定位、细胞类型识别和细胞间相互作用。
- 应用:主要用于神经科学中大脑区域的细胞图谱构建、肿瘤细胞的精细分类等。
- STARmap (Spatially-resolved Transcript Amplicon Readout Mapping):
- 原理:通过原位扩增和多轮测序,对数千个预选基因的mRNA进行空间定位和定量。
- 特点:单细胞分辨率,通量高,可实现全脑范围的基因表达图谱绘制。
- CosMx Spatial Molecular Imager (NanoString):
- 原理:基于高度多重化的荧光探针和循环成像技术,可在单细胞和亚细胞分辨率下定量检测数百到数千个RNA或蛋白质靶标。
- 特点:高分辨率、高通量、高多重性,可同时检测核酸和蛋白质,且兼容FFPE组织样本。
- Xenium In Situ (10x Genomics):
- 原理:结合了循环成像和原位测序的优势,能够对数千个基因在单细胞和亚细胞水平进行空间定位和定量。
- 特点:高分辨率、高通量、易于操作,特别适用于复杂组织和肿瘤微环境的研究。
空间转录组测序的独特优势
空间转录组测序的出现,弥补了传统转录组学技术的不足,带来了多方面的独特优势:
- 揭示基因表达的真实空间布局:这是最核心的优势,能够直观地看到基因在组织中的分布模式,例如肿瘤细胞与周围免疫细胞的相互作用。
- 深入理解组织异质性:能够识别组织内部不同区域或细胞群体的特异性基因表达特征,有助于区分肿瘤核心、浸润边缘、正常组织等不同微环境。
- 识别新型细胞类型和状态:通过结合空间信息,可以发现形态学上相似但基因表达谱不同的细胞亚群,或追踪细胞在病理进程中的状态转变。
- 解析细胞间相互作用网络:通过分析相邻区域的基因表达,推断细胞间信号传导、配体-受体相互作用等,从而构建细胞微环境中的功能网络。
- 发现潜在的生物标志物和治疗靶点:在疾病研究中,空间转录组测序有助于识别与疾病进展、治疗响应或耐药性相关的空间特异性基因表达模式。
- 与组织病理学信息结合:测序数据可以直接与高分辨率的组织切片图像进行叠加分析,实现分子层面与形态学层面的完美融合。
空间转录组测序的广泛应用领域
凭借其强大的空间解析能力,空间转录组测序技术正在多个生命科学和医学研究领域发挥着举足轻重的作用:
1. 肿瘤学研究
空间转录组测序在肿瘤研究中具有不可替代的价值,因为它能够:
- 解析肿瘤微环境(TME):详细描绘肿瘤细胞、免疫细胞、成纤维细胞、血管细胞等在肿瘤内部的空间分布和相互作用,理解它们如何影响肿瘤的发生、发展、转移和治疗响应。
- 识别肿瘤异质性区域:区分肿瘤核心、侵袭前沿、坏死区等不同区域的基因表达特征,有助于发现与恶性程度、预后相关的空间生物标志物。
- 评估免疫治疗响应:分析免疫细胞浸润模式、免疫检查点分子表达及其在肿瘤组织中的空间分布,为优化免疫治疗策略提供依据。
- 理解耐药机制:探究肿瘤细胞在特定空间位置上产生耐药性的分子机制。
2. 神经科学
神经系统是高度结构化的组织,空间转录组测序为理解其复杂性提供了独特视角:
- 构建大脑图谱:绘制不同脑区、神经核团中基因的精确表达图谱,解析神经元和胶质细胞的异质性。
- 研究神经退行性疾病:在阿尔茨海默病、帕金森病等疾病模型中,识别病理改变(如斑块、缠结)周围细胞的基因表达变化,揭示疾病进展机制。
- 解析神经回路功能:在特定神经回路中,研究不同类型神经元的空间分布和基因表达模式,理解其如何协调功能。
3. 发育生物学与器官发育
发育过程是一个高度时空调控的过程,空间转录组测序有助于:
- 追踪细胞命运:分析胚胎发育过程中不同细胞谱系的起源、迁移和分化路径,以及在此过程中基因表达的时空变化。
- 解析器官形成机制:研究器官形态发生过程中,不同细胞群体的空间组织和基因表达调控网络。
4. 免疫学与传染病研究
- 解析炎症反应:在感染或自身免疫疾病中,理解免疫细胞在炎症部位的浸润、活化状态和功能。
- 宿主-病原体互作:揭示病原体感染后,宿主细胞在感染部位的基因表达响应和病原体的空间分布。
5. 再生医学
- 评估组织修复与再生:分析损伤后组织修复过程中,细胞迁移、增殖和分化的空间模式。
- 优化干细胞治疗:理解移植干细胞在宿主组织中的定植、分化和整合,以及它们与周围微环境的相互作用。
空间转录组测序的数据分析与可视化
空间转录组测序产生的数据量庞大且复杂,其分析和可视化是整个流程中至关重要的一环,通常需要专门的生物信息学工具和流程。
1. 数据预处理与质控
包括原始测序数据的比对、去重、根据空间条形码进行UMI计数和空间信息分配,以及对数据质量的评估(如捕获效率、UMI数量分布等)。
2. 空间域识别与聚类
这是空间转录组分析的核心任务之一。通过无监督聚类算法(如Graph-based clustering),根据空间邻近性和基因表达相似性将组织切片划分为不同的“空间域”或“组织区域”,这些区域可能代表不同的细胞类型、组织结构或病理状态。
3. 细胞类型注释与映射
结合单细胞转录组数据(如果有),可以将空间数据中的“捕获点”(spot)或“细胞群”映射到已知的细胞类型上,从而在空间上定位不同细胞类型的分布。
4. 差异表达分析
比较不同空间域之间或特定感兴趣区域的基因表达差异,识别与特定空间位置相关的关键基因。
5. 细胞-细胞通讯推断
基于配体-受体基因对的表达模式,推断不同空间域或细胞类型之间的潜在细胞通讯网络。
6. 数据可视化
将基因表达量以颜色深浅或热图的形式叠加到高分辨率的组织图像上,直观展示基因在组织中的空间分布。常用的可视化工具包括Seurat、Squidpy、Scanpy、Giotto等。
空间转录组测序的挑战与未来展望
尽管空间转录组测序技术取得了显著进展,但仍面临一些挑战和发展方向:
- 空间分辨率与通量:如何在实现单细胞甚至亚细胞分辨率的同时,保持高通量和全基因组覆盖,是未来技术发展的重要方向。
- 数据整合与标准化:不同平台和技术产生的数据格式和特性各异,如何有效地整合多源数据并建立统一的分析标准是一个挑战。
- 多组学整合:将空间转录组与空间蛋白质组学、空间表观基因组学等数据进行多组学整合,将更全面地理解生物学过程。
- 计算生物学挑战:海量复杂数据的处理、分析和可视化需要更强大的计算资源和更智能的算法,特别是如何从空间模式中挖掘深层次的生物学机制。
- 临床转化:将空间转录组测序技术应用于临床诊断、预后判断和个性化治疗指导,是其长期发展目标。
展望未来,随着新技术的不断涌现和生物信息学工具的日趋成熟,空间转录组测序将持续推动我们对生物体复杂性的理解,在疾病诊断、药物研发和基础生物学研究等领域展现出更广阔的应用前景。
常见问题解答(FAQ)
如何理解空间转录组测序与单细胞转录组测序的区别?
空间转录组测序和单细胞转录组测序都是高通量测序技术,但它们关注的维度不同。单细胞转录组测序(scRNA-seq)旨在解析单个细胞的基因表达谱,从而识别细胞类型和细胞状态,但它在样本制备过程中会丢失细胞在原始组织中的空间位置信息。而空间转录组测序(ST)的核心目标是在保留组织空间结构的前提下,获取不同区域的基因表达信息,从而揭示基因表达的空间异质性,理解细胞与其微环境的相互作用。简单来说,scRNA-seq回答“有哪些细胞类型及其基因表达”,ST回答“这些细胞类型或基因表达在组织中位于何处”。
为何空间信息在生物学研究中如此重要?
生物组织是高度组织化的复杂系统,细胞的功能和状态往往与其在组织中的精确位置和周围的微环境密切相关。例如,在肿瘤中,肿瘤细胞与免疫细胞、基质细胞的相互作用决定了肿瘤的生长和对治疗的响应;在神经系统中,神经元在特定回路中的精确定位是其发挥功能的基础。传统方法无法提供这种空间上下文,使得我们难以理解这些复杂相互作用的机制。空间转录组测序能够补齐这一关键信息,使我们能够更全面、更深入地理解生物体在健康和疾病状态下的复杂生物学过程。
如何选择合适的空间转录组测序平台?
选择合适的空间转录组测序平台主要取决于您的研究目标、所需的空间分辨率、可接受的成本以及样本类型。如果您需要高通量、对整个组织切片进行无偏性的基因表达分析,并且能够接受相对较低的空间分辨率(约1-10个细胞大小的捕获点),那么10x Genomics Visium是一个很好的选择。如果您关注单细胞甚至亚细胞水平的精细空间定位,并且只需要检测数百到数千个预选基因,那么MERFISH、STARmap、CosMx或Xenium等基于成像的技术可能更适合。同时,还需考虑样本的兼容性(如新鲜组织、冷冻组织或FFPE组织)、数据分析的复杂性以及实验室的技术储备。
如何处理和分析空间转录组测序数据?
空间转录组测序数据分析流程通常包括原始数据质控、序列比对、UMI计数和空间信息映射。核心分析步骤包括:基于基因表达相似性和空间邻近性进行空间聚类,识别不同的空间域或细胞群;将空间数据与组织病理图像整合,实现基因表达数据的可视化;进行差异表达分析,识别不同空间域的特异性基因;利用细胞类型反卷积(Cell type deconvolution)或整合单细胞RNA测序数据,在空间上推断细胞类型分布;以及推断细胞-细胞通讯网络。常用的生物信息学工具包括10x Genomics的Space Ranger、Loupe Browser,以及开源R/Python包如Seurat、Squidpy、Scanpy、Giotto等。

