抗肿瘤药物能否通过真实世界证据（RWE）获批适应症？

时间：2022-12-22

　　20世纪70年代，从轶事到随机对照试验（RCT），医学证据发生了演变。这表示，监管机构批准药物和器械需要更高的标准。然而，RCT所需的临床研究成本、时间、复杂性均显著增加，故出现了加快审批的新机制，包括：队列扩展、加速批准、自适应临床试验设计、替代终点等。2016年12月，美国国会签署了《21世纪治愈法案》（21st Century Cures Act），其特点之一就是授权使用基于真实世界数据（real-world data，RWD）的真实世界证据（real-world evidence，RWE），作为药物和器械审批所需传统RCT证据的补充。

　　真实世界数据（RWD）是指在传统前瞻性临床试验预先计划分析之外收集的有关患者的数据，多在常规临床实践中产生。这些数据的常见来源包括但不限于：电子医疗记录、保险数据、患者登记、来自移动设备的数据等。RWD也可以从临床试验中收集，但指的是以新的方式分析数据，例如：以一种非前瞻性的方式分析临床试验的观察结果，通过多个临床试验的数据组合分析，或使用新型的研究等。RWD指的是数据的来源，通过分析方法产生临床循证，将它们转换为RWE。

　　在传统临床试验中，经过高选择的患者可能无法反映真实情况下患者的合并症、不同的社会经济背景、地区、健康知识水平或医疗保健可及性。此外，临床试验严格的监测条件与现实情况有很大不同。因此，RWE或可填补有关干预措施如何影响患者的重要知识空白。另一方面，更好地理解RWE与传统临床试验终点之间的关系，并克服RWE的缺陷是至关重要的。

　　众所周知，由于混杂因素、偏倚和不一致性，来自前瞻性临床试验之外的数据结果可能是不准确的。然而，RWE还存在许多较少讨论的平衡特征，使其成为值得更充分理解的数据源。随着电子数据记录的快速出现，有数百万的临床数据点和先进的计算机学习/分析能力，这在既往是不可想象的。Science Translational Medicine杂志在11月发表了观点类文章，讨论了肿瘤学背景下的RWD和RWE，这些理论也可推广到其他领域。

　　RCT是金标准但也存在局限性

　　RCT是明确治疗干预措施和结局之间存在因果关系的金标准。如果设计和分析得当，RCT可以纠正前导时间（lead-time）偏倚和时间长度（length-time）偏倚，并消除许多混杂因素。然而，RCT有一些内在的和实践上的局限性，导致其干预结果与现实世界中的干预结果不同。本文讨论了RCT中不常被提及的一些局限性。其他重要的问题没有详细描述，例如：患者选择的偏倚，偏离严格的研究设计，试验效力不足，以及与生存无关的替代终点的使用等。

　　RCT内在局限性

　　患者从RCT中退出可能是非随机的（例如：一般情况较差的患者，更有可能退出试验）或在不同的治疗组之间有所差异（例如：如果试验药物具有严重的不良反应，一般情况较差的患者，退出的比例可能高于对照组），这两者都是临床试验偏倚的来源。虽然统计学方法尽可能纠正这种患者退出，但这些方法依赖于强有力的假设。例如，随机缺失假设（missing-at-random assumption），要求在患者退出之前测量的变量能够准确预测患者的预后。随机缺失假设是不可检验的，研究人员无法确定他们的归因是否排除了一个影响患者退出和结果的重要混杂变量。

　　在RCT中，当患者的退出率较低时，非随机或组间有差别的退出率所产生的影响有明确的范围；当退出率较高时，随机研究相对于观察性研究的优势尚不明确。有一项针对71项主要医学期刊的RCT分析提示，近20% RCT的患者退出率＞20%。两个研究组间退出率相同也并不意味着试验结果是无偏倚的。对非随机退出产生的影响以及对其进行偏倚校正的回顾性分析结果显示：例如，EVERPRO RCT评估了依维莫司对晚期肾细胞癌的治疗效果，归因于偏倚或可使结果高估了74%。另有一项RCT的meta分析指出，95%的RCT存在数据缺失，45%的RCT没有考虑患者的退出率——它们只是进行了完整的病例分析（即：它们只分析没有任何缺失数据的受试者结果）。此外，RCT限制了预定义终点，例如：死亡率，但可能无法取得更广泛的相关结局，例如：“因特定原因住院”或“疾病恶化”，这些结果可在真实世界数据中获得。

　　尽管RCT确实具有消除许多混杂因素的独特能力，但它们不能完全消除所有的偏倚，因为研究参与者和相关人员内部存在某些固有的偏倚。例如，一项RCT的meta分析显示，除非采用双盲法并掩盖分配的随机性，否则它们可能高估了治疗效果。最后，患者选择性可能会影响RCT结果。例如，RCT可能会在全体研究人群中检测出获益不明显的治疗，而生物标志物可能会筛选出获益明显或有损害的亚组。

　　RCT在实践上的局限性

　　事实上，可能很难将对照良好的试验结果推广到真实世界中有合并症或其他情况的患者。美国成年癌症患者中只有不到5%参与了RCT，参与的人更年轻、身体状况较好、具备相关的健康知识、经济条件更好、更有可能在临床研究中心而不是社区医院接受治疗等。他们经常受到健康志愿者偏倚和其他选择偏倚的影响。即使在纳入的受试者中，RCT也可能无法捕捉到亚组信息，例如少数族裔群体的代表性不足。此外，RCT也存在其他偏倚。例如：盈利性医药公司对临床研究实验组的赞助；在罕见病或部分基因组亚型疾病的背景下，RCT最终可能在经济上不可行，或者可能需要很多年才能积累足够的患者。

　　最后，部分RCT不能实现，因为它们是不道德的。例如，目前没有试验将糖尿病患者随机分为胰岛素组和非胰岛素组，这样的试验会引起伦理问题。RCT的内在以及实践上的局限性，突出了需要用其他类型的证据来补充，以缩短研究时间，降低研究成本，提高研究代表性，并回答RCT可能无法解决的问题。

　　现实中的挑战

　　从传统RCT中得出的结论也不能幸免于实践中产生的一系列问题：医生、护士、医生助理、患者、家属、保险公司和其他相关方在临床决策过程中的影响。传统RCT在一个经过选择的人群中进行，而在临床实际情况下会发生什么？RCT需要很长时间完成，价格昂贵。因此在罕见癌症中，进行RCT令人望而却步。另一方面，过于限制性的纳入标准、随访、数据审核、特定的研究设计等，都是实际存在的不足。

　　基于RWE获得FDA的批准???????????

　　基于RWE，FDA已经对多种抗肿瘤药物的适应症给与了批准（下表）。最早的是在2006年，伊马替尼获批用于几种罕见疾病，包括：侵袭性系统性肥大细胞增多症、高嗜酸性粒细胞综合征、慢性嗜酸性粒细胞白血病和隆突性皮肤纤维肉瘤。该批准主要基于病例报告（case series），将每种疾病的驱动基因异常与伊马替尼的特定靶点联系起来的、令人信服的数据。

　　近些年，RWE已被用于推动各种其他抗肿瘤药物的适应症批准，包括：帕博利珠单抗（存在高度微卫星不稳定或错配修复缺陷，无法切除或转移性实体瘤的成人和儿童患者），阿维鲁单抗（avelumab，Merkel细胞癌），哌柏西利（男性乳腺癌）。这些批准的共同特征是，适应症非常小、具有特定性的、罕见的或非常罕见的人群。RCT对这些人群来说是不切实际的。这些适应症的获批需要基于对药物作用机制的生物学理解以及其对癌症驱动因素的影响。

　　如何完善RWD

　　有一项涉及220项高影响力的RCTs，探讨了有多少临床试验可以通过观察性方法或真实世界数据进行可行的复制。为此，电子健康记录或保险记录必须针对以下特征进行注释：治疗干预、适应症、纳入/排除标准和主要终点。这些特征分别在大约39%、72%、73%和73%的病例中，可以从RWD中提取出来。作者表示，15%的高影响力RCT可以被真实世界数据分析所取代。考虑到制药公司每年在3期或4期临床试验上的花费超过220亿美元，这将相当于有意义的投资重新分配，并加快患者获得可用药物或器械的速度。

　　在RCT DUPLICATE倡议以及其他努力下，正在开发可以构建和分析现有电子医疗记录数据的统计方法，以减少偏倚和混杂因素。在DUPLICATE项目中模拟RCT的前10项RWE研究，有8项得出了在相应RCT的95%置信区间内的风险比评估。

　　永恒（零）时间偏倚

　　观察性研究可存在许多偏倚。例如，与一个组相比，另一个组在一段时间内未能出现结局，就会出现永恒（零）时间偏倚。例如，在一项评估治疗干预与死亡率之间关系的研究中，对于那些接受治疗的人来说，时间“零点”是研究开始时。但是，如果治疗组在接受治疗之前有这么一段时间，暴露组的时间“零点”被设定为研究开始而不是暴露时间，就会发生永恒时间偏倚。因为这些受试者在这一段时间内是“永恒的”（如果他们在进入暴露组前死亡，就不会被纳入暴露组中）。这段在暴露“前”的额外时间，将给暴露组不真实的生存优势而使结果偏向于暴露组。

　　最佳实践/质量控制

　　为了让RWE在临床决策中发挥作用，必须能够对真实世界数据进行审查。这就需要获取源文件，如电子病历，并采取严格的质量控制措施。此外，部分卫生系统提取卫生保健数据的资源可能有限，部分卫生保健记录可能难以解读。机器学习和结构化数据输入的使用可能有助于应对这些挑战。

　　RWE和RCT之间的不一致

　　对于RWE无法重现RCT数据的批判性讨论有时本身就存在偏见或不足，处理相同临床问题的RCT在复制其他RCT方面可能并不比RWE更好。但是问题仍然存在：当RCT和RWE得出不同的结论时，哪一个与监管和临床决策更相关？差异在于是因为RWE失败了（例如：由于混杂因素）还是RCT失败了（例如：由于研究设计/分析有缺陷，患者选择有偏倚，或RCT不切实际的规定）?

　　第二个问题是关于每项研究的可取性——RCT的潜在收益须和其机会成本相平衡；较长的研究时间意味着患者获得药物的时间将延迟以及更高的财务成本。由于RWE开发的快速特性和较低的成本，我们是否可以更多地使用RWE？同时对RWE失败的可能性有一个可接受“阈值”？值得注意的是，RWE和RCT也不是相互排斥的。例如，在进行具有明确终点的RCT时，我们是否可以使用RWE来授予有条件的批准？

　　对未来的建议

　　RWE可能对医疗保险和医疗补助服务中心的证据开发（CED）项目特别有用，该项目允许根据持续的证据生成（包括通过正在进行的临床研究和真实数据）做出决策。通过观察性临床研究和记录干预措施安全性和有效性的登记，使得早期获得突破性药物和技术。例如，在RCT完成或最终被指南采纳之前，CT扫描是在医疗保健CED项目下进行了研究，这是在癌症筛查技术领域的潜在应用。对于大部分类型的癌症，没有以死亡率为终点的癌症筛查RCT，由于健康人群患癌症并死于癌症需要很长时间，且耗资巨大，在试验结束时往往已经过时。最近，美国预防服务工作组扩大了结直肠癌的筛查标准，是基于政府智库（RAND公司）牵头的分析，在缺乏RCT的情况下使用微观模拟数据。

　　另一个有价值的问题是，我们是否可以回顾性分析一些金标准RCT，明确是否可以通过分析RWE以一种更经济、更快速地方法得到相同的答案。有科学家提出了一个框架，当RCT不可用时，可以使用大数据来模拟目标试验。

　　目前的一个关键性挑战是，在紧急医疗需求和证据水平之间取得平衡。这种平衡对于癌症等致命性疾病至关重要，新冠大流行进一步凸显了这一点。这还表明，RWE和技术相结合，可以用一种独特的方式加以分析。最后，不可能通过RCT来解答所有的问题，在这些“空白”中，RWE优于完全没有证据。

　　参考文献??

　　Sci Transl Med. 2022 Nov 30; 14(673): eabn6911.

　　doi: 10.1126/scitranslmed.abn6911.