真实世界研究被认为是评估药物在常规临床实践中的长期安全性和有效性的重要资源,它包含了随机对照试验(RCTs)未纳入的患者。在这里,我们总结了真实世界证据(RWE)的价值和它们在临床研究中使用的相关考虑。
总纲要点:· RCTs 是研究药物疗效和安全性的金标准。
· RWE 贴近临床实践经验,增加外部效度,补充 RCTs 的临床发现。
直接比较 III 期临床试验和真实世界数据是不合适的,事实上,与其比较这两种研究,我们更应该明白它们是互补的。
理解前瞻性研究和回顾性研究的区别:
前瞻性研究先收集实时数据,可以回答许多重要的临床问题,并检测许多可能的决定因素;
回顾性研究分析已收集的数据,但是这些数据并非被设计用于某个研究,如果数据缺乏重要的协变量,那么很难纠正偏倚和混杂因素。我们需要确保数据足够有效、可靠和稳健,从而推断出有意义的临床发现。因此,当我们评估 RWE 的质量时,必须考虑以下几个关键问题(表 1):
研究假设是什么;
数据来源是什么;
研究人群是什么样的;
这些患者是怎么治疗的;
随访时长是多久;
结果怎么评估的;
灵敏度分析的有效性是多大;
表 1:真实世界研究评估表
1. 研究问题 | |
1.1 研究问题是与临床相关的吗?并在文中明确定义了吗? | [是/否] |
2. 数据源 | |
2.1 使用了什么类型的数据源? | 管理索赔/ 电子健康档案 /病人登记/其他(请注意) |
3. 研究人群 | |
3.1 与研究问题相关的是,是否最初定义的研究人群经过适当选择? | [是/否] |
3.2 是否研究人群限定于这种病的新治疗者(初治患者)? | [是/否,但有合理理由/否] |
4. 治疗 | |
4.1 研究是否充分描述了治疗方案? | [是/否] |
4.2 研究是否说明了药物剂量? | [是/否] |
4.3 是否暴露与非暴露人次无「永恒时间偏倚」? | [是/否] |
4.4 是否讨论了依从性/持久性? | [是/否] |
4.5 这样的对比是否为同步/同期的? | [是/否,但是使用历史对照组是合理的/否] |
5. 随访 | |
5.1 随访期是否足够长以确保可以获得有意义的结果? | [是/否] |
5.2 是否有信息审查? | [是/否] |
6. 结果 | |
6.1 评估了哪些结果? | [安全性和有效性/仅有效性/仅安全性] |
6.2 研究结果的定义是否明确且可复制? | [是/否] |
6.3 主要有效性终点和安全性终点的严重程度是否相当? | [是/否] |
6.4 在索引日期之前是否发现了有意义的主要结果? | [是/否] |
6.5 结果定义是否已被验证或判定? | [验证/判定/否] |
6.6 主要临床结果是否被客观地记录(不受人为因素的影响)? | [是/否/如果结果是非临床性的则不适用] |
6.7 结果是否也以绝对比率/数字表示,而不是仅以相对风险/风险比率/比值比来表示? | [是/否] |
7. 灵敏度分析 | |
7.1 是否有灵敏度分析以检测结果的不确定性? | [是,且主要结果无显著改变/是,但是主要结果发生巨大改变/否] |
8. 偏倚 | |
8.1 在研究中是否存在潜在的偏倚? 8.1.1 混杂 | [是/否] |
8.1.2 选择偏倚 | [是/否] |
8.1.3 错误分类偏倚 | [是/否] |
8.1.4 数据丢失所致偏倚 | [是/否] |
8.1.5 报告偏倚 | [是/否] |
8.2 在设计和/或分析中是否考虑到校正重要混杂因素和影响疗效的变量? | [是/否] |
8.3 论文是否讨论了研究的缺陷以及不同类型的偏倚如何影响结果,包括方向? | [是/否] |
根据欧盟临床试验 NIS 的定义,NIS 是基于日常医疗过程中、常规处方已经获得批准的药物的研究。患者分配到特定的治疗策略组不是由临床研究方案决定,而是医疗常规。为了获得最大的临床意义,NIS 产生的数据必须是高质量的,并且有各种指南来协助确保质量——即这些数据在使用时,能产生确定的、科学的发现。通过使用充分的研究设计和数据分析,以及确保数据的真实性、完整性和有效性,并迅速解决任何顾虑,也可以避免任何可能的偏倚。
· 利伐沙班应用于房颤(AF)的 NIS 研究的当前发现和分析
XANTUS 研究: 患者特征不同是不同临床研究之间横向对比的最常见障碍。ROCKET AF 和 XANTUS 研究患者的基线卒中风险存在差异,即 ROCKET 研究平均 CHADS2 为 3.5 分,而 XANTUS 研究的平均 CHADS2 为 2 分。XANTUS 研究和 ROCKET 研究结果:大出血分别是 3.1%/年和 3.6%/年,卒中和非中枢神经系统栓塞分别是 1.54%/年和 1.70%/年。灵敏度分析结果支持研究的结论。经校正人群特征后,ROCKET AF 研究在高卒中风险人群中的有效性和安全性在 XANTUS 研究得到了强而有力的证实。
XANTUS 研究的汇总分析:XANTUS 汇总分析包括三项前瞻性观察研究(XANTUS 研究、 XANTUS EL 研究、XANAP 研究),来自 47 个国家的 11,121 名患者纳入分析,76.8% 的患者随访超过 1 年,结果显示:超过 96% 的患者没有经历过任何药物导致的大出血、卒中/非中枢神经系统栓塞事件或全因死亡。共 172 名患者发生 190 个治疗相关大出血(1.7/100 患者年)。致死性出血、重要器官出血和颅内出血发生率分别为 0.2/100 患者年、0.6/100 患者年和 0.4/100 患者年。消化道大出血为 0.7/100 患者年,症状性血栓事件为 1.8/100 患者年,全因死亡为 1.9/100 患者年。XANTUS 汇总分析结果显示:利伐沙班的效果和安全性在世界不同地域/不同患者族群均是一致的,这也与 ROCKET AF III 期研究结果一致。
反映临床实践的(医保)索赔数据库正被更多地使用索赔数据由付款人收集,以跟踪和确保所提供的医疗服务的报销情况。数据可能是纵向的或横向的,但在本质上都是回顾性的。国家数据库包括美国的 Market-scan 商业索赔和意外及医疗保险数据库、法国和德国的 IMS Lifelink 疾病分析库、英国临床实践研究数据库、丹麦及瑞士国家数据库。某些索赔数据库是单一付款人,如医疗保险、美国国防部(DoD)军事卫生系统(MHS)、国家卫生保健数据库(如丹麦全国数据库)(各数据库详细信息请参见原文,本文从略)。大多数美国商业数据库并没有很长的随访期。此外,由于人们更换工作,与保险索赔相关的数据可能不够集中,每个保险公司的数据集可能只包含 2 到 3 年的信息。
数据库分析的价值和局限性尽管数据库分析是有用的,但也有局限性:
错误分类偏倚:由于患者分类的不准确或不充分造成的,并且可能由医疗编码器的诊断编码错误、「战术」编码或编码细节不佳引起。
混杂偏倚:与结果和暴露因素相关的特征之间的固有不平衡。
用于调整或平衡患者特征的方法可能不理想,例如回归和/或倾向性评分(由于调整、逆加权、「贪婪匹配」或高维匹配)。
在没有随机化的情况下,残余混杂总是存在的。
需要记住,这些数据最初并非用于研究目的,可能缺少重要信息,如实验室或诊断检测结果(如肌酐清除率、血清肌酐或 CT 结果)、生命体征或其他临床特征(心率、体重)、院外死亡率数据(虽然包括在政府数据库中,但访问常常受限,且没有可靠的报告)、定性数据(生活质量、患者满意度、对治疗决定的解释)、病史或合并症。
所包含的信息可能不能完全代表处方习惯,即选择一种治疗方法的原因。这可能对新型口服抗凝药(NOACs)尤其重要,因为这些药物会在不同时间被批准用于 AF 的卒中预防。
总之,尽管存在这些潜在的缺陷,但医疗索赔及电子健康档案数据库经常能发现 NOACs 在日常实践中使用的关键信息。
利伐沙班用于 AF:来自国家数据库的真实世界发现丹麦的全国性大型队列研究:阿哌沙班、达比加群和利伐沙班可作为华法林的有效替代药物应用于临床,尽管存在一些差异,但 NOACs 的缺血性卒中总体发生率与华法林相似,其中利伐沙班较华法林在缺血性卒中或全身性栓塞(复合终点)风险更低。
比较 NOACs 与华法林用于既往有卒中或 TIA 的 NVAF 患者的有效性与安全性(REAFFIRM 研究):和华法林相比,达比加群和阿哌沙班未降低缺血性卒中和颅内出血的复合终点事件,而利伐沙班可显著减少缺血性卒中或颅内出血的复合终点事件,三种 NOACs 在大出血方面和华法林相当。
美国国防部上市后安全性监测研究(PMSS 研究):该研究评估了在大样本 NVAF 患者中应用利伐沙班的安全性,数据来源于美国国防部军人健康系统(DoD MHS),和美国其他数据库相比,DoD MHS 能提供军人及其亲属多年的随访数据,结果显示,在真实临床实践中,接受利伐沙班治疗的患者(27,467 名)大出血事件发生率为 2.86/100 患者年,致死性出血发生率低:0.08/100 患者年。
在真实世界数据中比较口服抗凝药物的效用:聚焦出血风险· NOACs与维生素K拮抗剂(VKA)相比:胃肠道(GI)出血风险
出血风险是应用抗凝药物的主要顾虑,既往报道称,NOACs 较华法林的 GI 出血风险高。但美国一项关于达比加群、利伐沙班和华法林 GI 出血风险的研究结果发现,无论是 AF 和非 AF 患者,NOACs 的 GI 出血风险与华法林相似。另一使用 VA 药房数据库的研究分析显示,在住院患者中,华法林的 GI 出血事件风险是 NOACs 的 4 倍。另外,在比较 NOACs 和 VKA 在出血风险方面的 meta 分析得出了不同的结果。所以关于 NOACs 的 GI 出血风险依然存在争议,需要高质量研究进一步证实。
· NOACs 间的直接比较:少见
大部分真实世界研究对比的是 NOACs 和 VKA 在 AF 人群中的安全性,很少有 NOAC 间的比较。一项回顾性分析对比了利伐沙班 (20 mg od) 和达比加群 (150 mg bid) 在缺血性卒中、ICH、颅外的大出血(包括消化道大出血)及死亡风险的差异。该文章作者指出,基于索赔数据库的回顾性研究可能存在残余混杂因素。该作者早期的研究发现和华法林相比,达比加群显著增加消化道大出血风险(结果和 RELY 一致)。由于患者群体不同和随访期间监测不同,达比加群与利伐沙班或华法林在观察性研究中的对比结果不能轻易与注册的 RCTs 进行比较。重要的是,观察到的治疗效果的细微差异必须谨慎解读,同时需要考虑研究结果中的细微差异在临床实践中是否有实际意义。
我们必须注意,在 RWE 中观测到的出血事件不能简单归结到治疗药物上。此外,观测的结果可能受 NOACs 用药条件的影响,如剂量和频率。还有众多因素可能影响在常规实践中观察到的 NOACs 的临床结果,如患者特征、方法学和对出血的定义。
要点总结:一项研究不应该被另一项研究取代,也没有一种「一刀切」的方法来回答研究问题。
在不同国家和不同的患者群中进行的大量真实世界研究将为 NOACs 在 AF 患者中的有效性和安全性提供支持。值得注意的是,研究使用的方法的不一致会对结果产生重大影响。
并非所有问题都能在真实世界研究中得到充分的解决。
治疗方案的比较、结论的外推以及如何分析不同的 RCT 研究非常重要。
很明显,NOACs 比传统的标准治疗更有优势。
真实世界数据可以弥补 RCTs 的缺口。对于研究者和临床医生,要多加考虑以确保数据的稳健性和准确性。真实世界数据在支持非 VKA 口服抗凝剂(如利伐沙班)在日常实践中的有效性和安全性方面发挥了重要作用。
文章来源:Camm A J, Coleman C I, Larsen T B, et al. Understanding the Value of Real-World Evidence: Focus on Stroke Prevention in Atrial Fibrillation with Rivaroxaban. [J]. Thrombosis & Haemostasis, 2018.