转录组学 Tranomics
尽管基因组测序理论上可以捕获所有类型的变体,但非编码变体的优先级和解释仍然是一个巨大的挑战。用转录组学补充 DNA 测序有助于优先考虑潜在的致病变异。在本节中,我们回顾了四种分析 RNA 测序数据以优先考虑罕见疾病候选基因的方法——表达异常值、异常剪接、等位基因特异性表达和转录组结构变异。接下来,我们讨论了长读长测序在高精度预测可变剪接和基因融合方面的潜力。我们还强调了单细胞转录组学在阐明涉及罕见、未发现细胞群的罕见和未确诊疾病的细胞和分子机制方面的潜力。
RNA 测序可以帮助对未知意义的变异(VUS) 进行分类,并提供对疾病机制的见解或识别隐性疾病中第二个等位基因中的变异,其中基因组测序仅返回一个致病变异。在一组 50 名患有罕见肌肉疾病的患者中,他们患有非诊断性 ES 和/GS,Cummings 等人证明了对受影响组织(肌肉)进行 RNA 测序的效用,诊断率为 34%。基因表达和 mRNA 异构体可能因组织而异,因此建议使用受影响的组织进行 RNA 测序。但与疾病相关的组织并不总是很容易以非侵入性方式获得,血液、成纤维细胞和诱导多能干细胞 (iPSC) 似乎是有希望的替代品。通过对 94 名未确诊患者的血液进行 RNA 测序,代表 16 种不同的疾病类别,Fresard 等人在 7.5% 的病例中发现了致病变异,证明了血液转录组测序有助于诊断罕见孟德尔疾病的潜力。李等人通过对来自 48 名基因组检测阴性个体的血液、成纤维细胞和/或肌肉样本中的 mRNA 进行测序,报告了 14.5% (n ?= ?7) 的诊断率,受试者主要受神经系统疾病 (n ?= ?25) 和肌肉骨骼疾病 (n ?= ?12) 的影响。他们在七名患有神经或肌肉骨骼疾病的患者中发现了致病性剪接异常。他们观察到成纤维细胞是比血液更好的组织选择,用于识别该队列中的剪接缺陷。同样,Baynam 等人报告了一例巨脑-毛细血管畸形综合征,其中在成纤维细胞中检测到致病突变(PIK3CA 中的镶嵌现象)而不是在血液中。
然而,许多基因在血液和成纤维细胞中的表达水平非常低,需要通过 RNA 测序在高深度捕获。CRISPR/Cas9 技术可用于以可扩展的方式提高低表达基因的覆盖率。黄等人应用CRISPRclean 方法,使用 Cas9 核酸酶和360,000 个引导 RNA 从 4000 多个目标基因中特异性去除 RNA-Seq 文库片段,观察到与未经处理的 RNA-Seq 文库相比非目标基因的覆盖率增加了约六倍。当已知候选基因在血液和成纤维细胞中低水平表达时,iPSC 是一个很好的替代品。最近,邦德等人集合了来自五项主要 iPSC 基因研究的统一数据,以创建集成的 iPSC QTL (i2QTL) 联盟。与非疾病基因相比,他们观察到已知罕见疾病基因的异常值富集了五倍,并证明在 Bardet-Biedl 综合征和遗传性小脑共济失调患者中检测到基因异常值。因此,当受影响的组织无法用于转录组分析时,应仔细考虑替代组织,如成纤维细胞、iPSC 和血液。在下一节中,我们将讨论转录组测序如何发现致病性突变,而这些突变是仅通过研究基因组变异而遗漏的。
表达异常值Expression outliers
在处理罕见和未确诊的疾病时,假设大多数样本在其生理范围内表达每个基因,目标是从每个样本中识别出表达水平极高或极低的基因。这是通过将每个患者与队列中的其他患者进行比较计算 Z score来实现的,GTEX和 GEUVADIS 是额外对照 RNA-seq 样本的重要资源。应用表达异常值方法时应谨慎。例如,对照应该来自与疾病样本相同的组织类型;数据应针对批次效应、性别或活检部位进行标准化。最近的方法,如 OUTRIDER和 PEER 控制用于基因之间的技术和生物学变异,前者也为RNA-seq 样本中的异常值检测提供了统计测试。弗雷萨德等人展示了他们的表达异常值管道如何优先考虑两个患有MEPAN 病的兄弟姐妹的前 15 个候选基因中的致病基因(MECR)。总体而言,分析表达异常值以及基因组变异和患者的表型可能是识别用于临床解释的强大候选变异的有力策略。
异常剪接变异Aberrant splicing variants
可变剪接是真核生物中一种自然发生的现象,导致单个基因编码多种蛋白质。转录后,非编码序列(内含子)从前 mRNA 中去除,一些外显子可能包含或排除在最终加工的 mRNA 中。这个过程中的错误会导致多种疾病,包括罕见的孟德尔疾病。剪接突变大致可分为五类:外显子跳跃、包含内含子假外显子、外显子延伸、外显子收缩和内含子保留。LeafCutterMD 和 Fraser 等算法提供了统计框架,旨在预测罕见疾病中的剪接异常值。
某些类型的变体,如同义变体和深度内含子变体,通常会被优先级管道过滤掉,除非它们以前与疾病相关。此类变体可能导致异常剪接事件,并且可以使用转录组数据重新确定它们的优先级。李等人已经展示了 RNA 测序如何帮助鉴定一名 2 岁女孩的第二个变异,该女孩患有不确定的trio WES结果,该女孩报告了 SEPSECS 基因 (OMIM 613009) 中的父系遗传移码突变,与常染色体隐性2d 型遗传性脑桥小脑发育不全相关。WGS 未发现任何致病性母系遗传编码变异。然而,来自先证者和母亲的转录组学数据显示,他们在 SEPSECS 基因中的一半reads跳过了带有同义变体的外显子 7。这在早些时候被遗漏了,因为通常,在基因组数据的变异优先级排序过程中,同义变异会被过滤掉,除非它们先前被报告为致病性。
等位基因特异性表达
等位基因特异性表达 (ASE) 是二倍体或多倍体基因组中的一种现象,其中一个等位基因的表达明显高于另一个等位基因。当使用隐性遗传模式对来自 ES/GS 数据的变异进行优先排序时,会过滤掉单个杂合的罕见变异。然而,这些杂合的罕见变异中的一些可能表现出 ASE。Gonorazky 等人报道等位基因失衡方法为三名单基因神经肌肉疾病患者提供了诊断线索,这些患者以前有非诊断性 ES 和/或基因组结果。克雷默等人讨论他们的 ASE 管道如何帮助建立粘脂贮积病患者的基因诊断,该患者在血液白细胞中对 1、2 和 3 型粘脂贮积病可用的酶检测结果呈阴性。他们在 MCOLN1 基因的内含子变体中检测到临界非显着低表达,该基因被他们的 ES 管道过滤,因为它是内含子。因此,除了识别表达异常值和剪接变体外,ASE 分析应该作为常规RNA-seq 分析的一部分进行,尤其是当基因组数据仅识别出隐性疾病的一个杂合变体时。
转录组结构变异
结构变异 (SV),如易位、重复、倒位和缺失,将不同的基因组区域连接在一起或将一个区域分成几块。此类区域的转录可导致基因融合(来自两个或多个不同基因的外显子一起转录)或导致先前未转录的区域包含在基因中,这通常导致两种情况下的基因功能改变。由基因组 SV 引起的转录 mRNA 中的这种修饰称为转录组结构变体 (TSV)。
融合基因在血液和实体组织癌症中得到充分证明,并被用作早期诊断和治疗靶点的生物标志物。独立案例研究报告了许多非癌症疾病的融合转录物,如脑畸形、智力残疾、痉挛性截瘫和 Gille de la Tourette 综合征。Oliver 等人为罕见病定制了一个融合鉴定流程,并将其应用于一组 47 名之前通过外显子组测序诊断为阴性或部分诊断的个体。他们确定了 8 个使用传统方法确认的融合事件,其中 2 个为患者的表型提供了临床诊断。他们使用trio外显子组测序在一名患有 T 细胞淋巴细胞减少症的婴儿的 ATM 中发现了父系遗传的致病性移码 INDEL。致病性 ATM 变异以常染色体隐性方式导致共济失调毛细血管扩张,但患者的外显子组数据未显示 ATM 中的第二个反式变体。患者成纤维细胞的 RNA 测序确定了相互的 ATM-SLC35F2 和 SLC35F2-ATM 融合转录物,表明染色体倒位,后来通过受影响的内含子的靶向长读长测序得到证实。
长读转录组学
与微阵列相比,短读长 RNA 测序是一种成熟且优越的基因表达定量技术。然而,片段化、短长度的读取使得转录本的计算重建具有挑战性,特别是对于包含许多相似亚型的复杂基因或基因家族。长读长技术可以通过对 cDNA(Pacific Biosciences 和 ONT)或天然 RNA(ONT)进行测序来确定全长 RNA 转录物的序列,较长的读数可以跨越整个转录本的序列,从而确定潜在的外显子组合。因此,长读长 RNA 测序可以改进对可变剪接的分析,从而可能导致发现新的亚型和新的基因融合。最近的研究已经在健康和疾病状态下使用长读长 RNA 测序确定了许多新的相关异构体。长读长 RNA 测序还允许通过单倍型定相识别等位基因特异性表达。
单细胞转录组学
尽管批量 RNA 测序有可能识别罕见疾病的分子原因和疾病机制,但它仅捕获样本中的平均表达信号,其中可能包含不同的细胞类型。相比之下,单细胞 RNA 测序 (scRNA-seq) 测量每个细胞内基因的表达,使研究人员能够研究样本异质性和细胞间变异。这使我们能够发现新的稀有细胞类型,从而提高我们对疾病机制的理解。然而,与大多数新技术一样,与批量 RNA-seq 相比,scRNA-seq 具有技术挑战(捕获效率低和数据极其稀疏)和高成本。scRNA-seq 数据稀疏,观察到许多零,表明特定细胞中的给定基因没有唯一的分子标识符或读取映射到它。这可能代表真正的生物学(真正沉默的基因)或技术误差(基因表达但未通过 scRNA 测序检测到)。scRNA-seq 的另一种方法是使用反卷积方法从大量 RNA-seq 中推断样本的细胞成分。迄今为止,已发布了 50 多种反卷积方法,可大致分为基于标记(使用标记基因列表进行反卷积)、基于参考(对于反卷积过程,它使用细胞类型特异性基因表达谱和差异列表 在参考中跨细胞类型表达基因)和无参考。
随着单细胞测序技术的不断改进,scRNA-seq 能够在许多不同的组织(如血液、脑、胰腺和癌症等)中发现许多罕见的新型细胞类型或亚细胞群或标记物 和算法,我们预计其应用将在未来扩展到罕见病研究。对每个细胞中转录组的综合表征可能有助于在罕见病患者的组织中发现新的细胞和分子成分,并有助于阐明疾病机制。
来源:周叔说生活
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!