# 基因检测产品的诞生之初 #
近年来,随着分子生物学、微流控技术和测序技术的发展,对单个细胞进行高通量测序成为可能。2013年和2019年,单细胞基因组和转录组测序(single-cell DNA/RNA sequencing)及单细胞多组学(single-cell multimodal omics)技术两次荣膺《Nature Methods》杂志的年度技术。在肿瘤的相关研究领域中,单细胞测序技术具有广阔的应用前景,在描述肿瘤及免疫细胞异质性、肿瘤细胞基因组突变及结构变异、克隆结构改变和免疫微环境改变等方面均提供了重要帮助。在这一期中,我们将以单细胞转录组测序技术为核心,对单细胞测序技术进行系统性的讨论。
图1. 单细胞多组学技术
单细胞转录组测序(scRNA-seq)测序技术简述
单细胞转录组技术作为时下最为流行的单细胞测序技术,已经具备多种较为成熟的测序方案,大多测序方案基于二代高通量测序(NGS)平台进行测序,但无论何种技术方案,其步骤均可大致分为以下六步:(1)从样本中分离单个细胞;(2)从单个细胞中捕获mRNA;(3)将mRNA逆转录为cDNA;(4)对cDNA进行扩增;(5)文库构建;(6)测序。
图2.单细胞测序流程
根据细胞分离和捕获技术的异同,可以分为plate-based和droplet-based两类,前者通量较低,但通过搭配全长转录本测序(full-length transcript sequncing),可以检测到较为稀有的转录本,具有较高的灵敏度。droplet-based技术基于微流控技术,可以捕获数倍于前者的细胞,通过在建库过程中加入唯一分子标记(UMI)可以有效地降低技术误差,搭配3‘/5’端转录本测序(3’/5′-end transcript sequencing),从而一次性获取成千上万的单细胞转录组数据,但需要注意的是,对于每个细胞,后者的测序深度较低,通常会丢失部分转录本的信息。
数据分析流程
单细胞转录组的数据分析通常从拿到下机数据转化而来的表达谱矩阵开始,主要步骤包括质控、标准化、特征基因的选择、批次处理、降维、聚类及可视化、细胞亚群注释、下游个性化分析等。
质控:与下机数据的质控不同,此时质控目的是为了过滤掉数据中的低质量(low-quality)细胞。一般常用的方法为根据每个细胞的基因数量、基因表达量以及线粒体含量进行过滤,除此之外,还可以通过Scrublet等工具对empty和doublet细胞进行识别和过滤。
标准化:根据不同的细胞捕获及建库方法,数据的标准化方法略有不同,例如全长转录本测序的数据通常与bulk RNA-seq相同,采用TPM(transcripts per million)进行标准化,而其他方法建库的数据大多采用CPM(counts per million)进行标准化。
特征基因选择:为了更加准确的达成分析目的,也为了减轻后续分析的计算压力,一般会根据方差筛选出一些带有“有效信息“的基因作为特征基因,通常特征基因的数量在1000-3000不等。
批次效应处理:随着测序价格的降低和研究目的的需要,研究涉及的样本数量和数据集越来越多,技术原因带来的批次效应不可避免,如何有效的去除样本间 的批次效应逐渐成为确保分析结果准确性的基石之一。目前常用的批次效应处理工具有Seurat-CCA/RPCA、Harmony和LIGER。
降维:为了克服”维度灾难“,同时使得数据可以可视化,降维是进一步分析数据的关键步骤之一。PCA作为成名已久的降维算法,理所当然的被应用于单细胞转录组的数据处理中。同时,随着深度学习的发展,也有基于深度学习的降维算法被应用于数据处理。
聚类及可视化:将具有相似特征的细胞无监督的划分为不同亚群(cluster)的过程即为聚类。可视化是对聚类结果的展示,常见的可视化算法包括tSNE和UMAP。
细胞注释:细胞注释是赋予数学算法聚类的结果以生物学意义的关键步骤,目前常用的注释方法分为两类,一类为根据marker(标记)基因进行人工判定,另一类为根据参考数据集进行自动化判断。前者需要分析人员具备一定的生物学背景知识,而后者需要和待注释数据集高相似度的参考数据集。
下游个性化分析:在得到注释完备的单细胞转录组数据后,可以根据实验目的和实验设计进行下游的个性化分析,一般的分析包括研究不同细胞亚群生物学功能的差异基因及通路富集分析、研究细胞变化轨迹的拟时序分析以及研究细胞状态变化过程中关键基因的基因表达动态分析等。
此外,由于单细胞转录组测序技术的广泛应用,已有成百上千款各种各样的分析工具被开发并应用于不同目的的数据分析中,如何从中选择合适的工具进行分析也是分析者需要考虑的问题之一。
实际应用案例
目前,肿瘤细胞和免疫细胞的异质性以及肿瘤的免疫微环境是单细胞转录组技术应用最为广泛的研究领域之一。
应用案例1:
前列腺癌是全球男性第二常见的恶性肿瘤,前列腺癌肿瘤微环境的研究一直是热点领域。美国加利福尼亚大学Hanbing Song等人的研究团队通过对局部前列腺癌患者的前列腺活检、前列腺切除标本和患者衍生的类器官样本进行单细胞转录组测序,揭示了前列腺癌患者中前列腺上皮细胞的细胞异质性。研究者发现了一群之前未被报道过的、与前列腺癌的发生发展有关的club细胞。研究者们还发现,ERG-的肿瘤细胞与周围的上皮细胞具有同样的异质性,并且会引起常见的肿瘤微环境的反应。相比于正常前列腺样本中的上皮细胞,AR信号通路更加的富集于前列腺癌样本中的上皮细胞。该研究加深了我们对于前列腺癌肿瘤微环境的进一步理解。
图3. 研究取样示意图
应用案例2:
靶向T细胞的肿瘤免疫治疗已使许多癌症患者受益,但在不同癌症中的临床疗效差异明显。北京大学张泽民教授团队整合了来自21个不同癌症类型的316名患者的近40万T细胞的单细胞转录组数据,对泛癌
来源的T细胞进行了系统性的分析并绘制了T细胞图谱。该研究团队发现耗竭的CD8 T细胞在不同肿瘤中具有高度的异质性,同时其耗竭路径也不尽相同。部分T细胞群体与患者的某些特性(如肿瘤突变负荷等)呈现相关性,揭示了肿瘤微环境的潜在决定因素。根据肿瘤内T细胞的组成可以将肿瘤患者分为TexhighTrmlow和TexlowTrmhigh两组,从而为T细胞免疫和靶向T细胞的精准免疫治疗提供了新的思路与观点。
图4. 研究流程及主要发现
应用案例3:
尽管黑色素瘤患者从免疫治疗中获益的比例很高,但大部分患者仍然死于疾病进展。为了确定与免疫治疗成功与否相关的因素,美国哈佛医学院的Moshe Sade-Feldman等人收集了32名接受了免疫治疗但获益情况不同的患者,并对其治疗前后的肿瘤样本中的CD45+免疫细胞进行了单细胞转录组测序。研究发现,两个不同的CD8 T细胞亚群与患者肿瘤消退或进展相关。多个肿瘤样本的CD8 T细胞中均观测到TCF7这一转录因子,该转录因子在独立数据集中被证实可以预测免疫治疗的疗效。不仅如此,研究者进一步在体外和动物实验中验证了同时阻断CD39联合免疫检查点抑制剂可以增强抗肿瘤反应,从而提高患者的生存。
图5. 研究流程及主要发现
单细胞转录组测序之外
除单细胞转录组之外,其他不同维度(例如基因组维度)的单细胞测序技术同样为我们理解肿瘤提供了有力的帮助。单细胞免疫组库测序(single-cell TCR/BCR sequencing)通过对T细胞或B细胞受体进行测序,可以描述T/B细胞的克隆性、多样性、抗原特异性以及与免疫微环境的联系,配合单细胞转录组数据分析,有助于揭示免疫治疗前后,T细胞与B细胞的变化,寻找免疫治疗的靶点。单细胞基因组测序(single-cell DNA sequencing)可以了解肿瘤组织中单个细胞之间的异质性,并系统性的分析单个细胞的遗传信息变化,例如突变和结构变异等,为耐药突变的筛选提供更为广泛的信息。表观遗传的单细胞测序技术包括单细胞DNA甲基化测序、单细胞染色质可及性测序、单细胞组蛋白修饰测序等。通常此类数据会结合单细胞转录组数据一同进行分析,从而提供不同维度的信息以供结果解读。
仁东医学自成立以来,贯彻聚焦垂直瘤种、助力临床决策的企业使命,以成为肿瘤精准诊疗一体化解决方案的领导者为企业愿景,秉承客户第一、合作创新、敢拼敢赢、科学、远瞻、高效的企业价值观,力求为肿瘤患者与临床医生提供可靠的基因检测服务。仁东医学研究院目前已经参与了多项单细胞测序相关的科研项目,部分项目已有学术成果产出,在单细胞转录组及多组学方面积累了丰富的数据分析和结果解读的经验。
来源:仁东医学
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!