近年二代基因测序(next-generation sequencing,NGS)技术快速发展,其应用已进展至临床检测,如遗传疾病、实体肿瘤、血液肿瘤、感染性疾病、人类白细胞抗原分析及非侵袭性产前筛查等。中华医学会病理学分会和中国抗癌协会肿瘤病理专委会前期组织病理、临床、生物信息等专家进行了充分讨论,拟在 NGS 的操作流程、数据处理、结果解读等方面作规范和建议,以规范 NGS 在分子病理领域的应用。
llumina 公司让基因成为人们生活中更为重要的角色。基因组学的重要性和价值将得以挖掘,势必会产生巨大的经济价值。
如果您曾经使用过 23andMe,Ancestry 或者任何其他基因测定服务,那么很有可能你的基因已经被价值 250 亿美元的生物仪器设备测定过了。作为美国 DNA 测序领域的领头羊,Illumina 通过销售它的基因测定硬件及试剂给全世界的医疗开发人员,目前已经超过了所有的竞争对手。
临床分子病理实验室 NGS 样(formalin-fixedparaffin-embedded,FFPE)、新鲜组织、各种体液上清液、体液离心细胞块、石蜡包埋标本和血浆 / 血液标本等。本共识特色是基于病理评估的组织样本(FFPE、新鲜)的规范。测序分析范围基于目前临床需求,本共识着重在于目标区域测序(panel)分析的实践。随着技术的更新和应用的成熟,本共识将持续更新以满足临床需求。
一、实验室总体要求
1. NGS 检测人员的资质要求:NGS 检测技术人员应具备临床病理学、分子生物学的相关专业大专以上学历,并经过 NGS 技术的理论与技能培训合格。数据分析人员应具有临床医学或分子生物学或遗传学知识背景并经生物信息学培训。最终报告应由中级或硕士以上具有病理学背景、经培训合格的本单位执业医师或者授权签字人 (医学博士学位或高级职称) 审核。
2. NGS 检测实验室的区域设置要求:原则上 NGS 实验室应当有以下分区:样本前处理区、试剂储存和准备区、样本制备区、文库制备区、杂交捕获区 / 多重 PCR 区域(第一扩增区)、文库扩增区(第二扩增区)、文库检测与质控区、测序区、数据存贮区。各工作区空气及人员流向需要严格按照《医疗机构临床基因扩增检验实验室工作导则》。分区可根据实际情况合并,但是在前处理和建库时,血液样本应与组织样本分开。
3. NGS 检测试剂及项目要求:试剂和测序平台均应选择中国食品药品监督管理总局 (CFDA) 认可产品。涉及到实验室自配试剂,应该有严格的试剂制备标准操作规程(SOP),需经过临床实验室自建项目 (LDT) 验证合格才可使用。每个 NGS 检测项目在验证时需要根据建库方法、测序平台和分析工具以及不同的突变类型包括,单碱基突变 single nucleotidevariant,SNVs、小片段插入或者缺失(Indels)、基因拷贝数变异 Copynumber variations(CNVs)、染色体结构变异,structuralvariation(SVs)以及不同的样本类型(如 FFPE 组织、新鲜组织、全血、胸水等)对特定 panel 的准确性、精确性、敏感性、特异性等性能参数进行 LDT 验证。应该有经过标准品测试的在不同的 mutant allele frequencies(MAF)下,不同测序深度的灵敏度及特异性数据,确定不同样本的可信的测序深度。经验证后,SOP 发生的任何改动,包括试剂、仪器、基因项目等都需要重新做验证。验证实验结果签名留底备案。
4. NGS 检测实验室的质量管理要求:NGS 检测主要包括实验操作和生物信息学分析两部分。实验操作部分包括样本准备、文库制备、编码(barcoding)、目标区域富集、测序等;生物信息学分析部分包括定位(mapping)、比对、变异识别、变异注释、变异解读及报告等。上述流程均需要建立实验室质量管理体系文件和 SOP 及机器运行和维护 SOP,具有严格的室内质控措施;定期参加室间质评以有及持续的质量保证和改进计划。
二、NGS 分析样本、基因 panel 和转运要求
• NGS 分析样本类型可采用 FFPE 样本、新鲜组织、各种体液上清液、体液离心细胞块石蜡包埋标本和血浆 / 血液标本等。
• 对于肿瘤体细胞变异初次 NGS 检测应首-选经病理评估的组织样本,在此数据基础上的再次检测可选取液体样本动态监测。
• NGS 检测前需通过病理诊断明确其肿瘤的性质及含量,根据不同肿瘤类型选择合适的基因 panel 测序。
• 不同疾病的基因 panel 列表,必须由临床与检测机构的专家共同决定,已达到不同实验室之间的可比性和完善性。
• 未经病理评估的基因检测结果不可单独用于分子病理临床诊断目的。
• 样本质量对检测结果和分析至关重要,病理医师需要对可评估的样本进一步明确病理诊断,并评价标本有无出血、坏死和不利于核酸检测的前处理(例如含 HCl 脱钙液处理),病变细胞(如肿瘤细胞)的总量和比例,避免假阴性。组织标本中肿瘤细胞含量建议达到 20% 以上,低于此标准可富集后检测。
• NGS 检测实验室应对不同类型的样本有采集及处理 SOP 指导。对于不同的样本(FFPE、体液、血液等)实验室应有不同的样本运送 SOP,物流环节(含冷链运输)应有相关运送记录,确保样本运送安全、无污染、无降解。
三、NGS 检测流程中的质量标准
1. 核酸提取及其质量分析:提取的核酸质量是 NGS 检测成功的关键因素,在制备文库前应采用多种方法对核酸质量评估,包括纯度、浓度和完整性分析。需要根据不同的样本类型制定相应的 SOP 用以鉴定核酸的纯度、浓度、完整性或降解程度等。并对应明确接受和拒绝的标准。
2. 文库制备及其质量分析:文库制备方法主要有杂交捕获和扩增子建库,无论采用何种方法制备文库和平台检测,都应对检测基因、区域或突变热点进行描述,并建立实验室检测 SOP。建立好文库后上机测序前需对文库进行质量分析。每个检测项目应设定其文库质量的要求,明确接受或拒绝的标准。
3. NGS 测序仪上机分析及其质量分析:NGS 建库主要有扩增法和捕获法两大策略,测序时根据检测样本量和质量要求确定适当的芯片,以保证测序质量和靶区覆盖深度。录入样本编号、检测内容、设定参数等信息,按仪器操作流程进行测序。
4. NGS 检测中的样本追踪及对照设置:
(1)样本追踪:为确保检测过程中样本没有混淆或污染,可选用多个 SNV 位点或其他标签作为样本身份标识(sample ID),在检测前对每个样本进行 SNV 位点信息的测定,在 NGS 检测后对上述位点进行追踪,证明没有交叉污染。
(2)阳性对照:应用组合型质控材料,可采用已知突变信息的混合样本,以模拟样本的复杂性。实验时同时检测,以确保其检出能力。
(3)阴性对照:用无核酸或明确无突变的样本作为模板同时进行检测,以确保检测过程中没有污染或非特异性。
(4)应对方案和替代方法:各个质量控制步骤中如出现异常或失败,实验室应有应对措施或备选方案;对于测序结果质量差或有问题的区域应建立替代方法(如 Sanger 测序)。
四、生物信息分析
NGS 数据的生物信息分析可分为两个主要步骤:一是对测序数据进行质控分析及过滤。二是对通过质控的序列进行变异位点鉴定分析并注释。所用各种生物信息分析软件,都要通过适量标准品测序数据进行验证,证明所用软件及参数可达到临床报告的要求。
1. NGS 生物信息分析流程标准:
(1)质控分析:为保证分析结果的可靠性,需要对原始的测序数据进行质量控制与过滤。测序数据的质量控制主要包含 4 个方面:质量评估、去接头序列、去低质量序列、去重复序列。
(2)序列比对(mapping):将通过质控后每一条 read 与参考基因组进行比对,回贴到基因组上最佳位置。
(3)变异鉴定:对每个位点进行变异鉴定。在肿瘤 panel 测序中,主要检测 SNV 和 Indel 两种突变类型,参数调整后可分析 CNV。部分 panel 的设计还可以鉴定染色体易位。对于肿瘤 panel 基因测序数据,鉴定后的变异位点都需要进行该位点可视化查看和确认,如 The IntegrativeGenomics Viewer (IGV)。
(4)变异注释:基于通用数据库,对突变基因位点进行功能注释,详见下文。
2. NGS 生物信息分析流程质量管理:实验室应建立生物信息学程序 /Pipeline 的书面质量管理 (QM) 计划文件。必须包含每次运行时监测和评估运行性能的指标和质控参数,以及定期(例如每月、每季度)监测的指标和质控参数。指标和质控参数可包括但不限于标准品的突变类型及百分比。生物信息分析流程建立后,需要采用已知变异类型和变异频率的标准品进行验证,验证其特异性和灵敏度是否达到实验室要求。验证结果签名留底备案。
(1)NGS 数据存储:实验室需要在生物信息分析过程中对原始数据及最后的结果数据进行标准化存储,并要保存相应的年限以备查。
(2)版本可追溯性:每份病例数据分析报告中,生物信息数据分析流程所涉及软件、算法、参数及数据库的版本必须可溯源。
(3)异常记录。实验室需要建立一个异常记录文档,用来记录偏离 NGS 生物信息分析标准分析流程的检测。
3. NGS 生物信息分析质量指标
4. NGS 数据存储格式标准:为了规范和管理各类数据,各个实验室需按照编号进行数据管理,所有数据按照国际标准格式进行存储。必须建立本地变异数据库(用于检验变异真实性)。
5. NGS 数据存储传输及共享安全标准:实验室需要制定规章制度以确认测序。数据在内部及外部存储及传输过程中的安全性和机密性。正常人群的变异数据应该共享。
五、NGS 结果解释及报告
1. NGS 临床报告包含内容:基于高通量测序技术,临床实验室比较容易的获取更高通量的临床样本检测数据,不可避免会检测到意义未知的变异位点,在实际工作中会有一定的不确定性。
2. 基因变异的命名:在描述所检测出的基因变异时要遵循一定的原则和规范,推荐使用人类基因组变异协会命名指南。对于遗传病相关基因变异命名,推荐美国医学遗传学学院
3. 临床意义的解读和批注:对于肿瘤体细胞突变,根据突变的类型和已有的报道及指南,基因变异提倡分级的处理方式
4. B 级:尚未进入诊疗指南,但已经写入该领域的专家共识的变异位点。注释时要批注研究报道及专家共识的来源,明确其药物及其临床意义、正在开展的状态等信息。
C 级:FDA 或 CFDA 批准用于其他肿瘤可预测疗效的基因变异,或者正在进行中的临床试验变异位点。注释时要批注用于其他肿瘤的权威指南,研究文献及临床试验正在开展的状态等信息。
D 级:处于学术争议或临床意义不明确的基因变异。同一实验室应该有统一的政策用来应对检测过程中出现的临床意义不明变异情况。
对于以上几种情况在报告的时候注意客观平实地描述检测的结果,在病理报告中不能出现建议使用何种治疗手段或策略的语言。
5. 意义不明位点的处理:由于通量的增加和人种差异,临床肿瘤样本可能发现新的变异位点。实验室必须制定相关政策方案用来应对检测过程中出现的临床意义不明变异情况。政策可以是一发现变异就报告,但附上说明和意义。也可以是不报道这些发现或只报道小部分变异结果。