前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Nat. Mach. Intel. | 基于真实世界患者数据的药物重定位的深度学习框架

Nat. Mach. Intel. | 基于真实世界患者数据的药物重定位的深度学习框架

作者头像
DrugAI
修改2021-02-02 11:33:24
8610
修改2021-02-02 11:33:24
举报
文章被收录于专栏:DrugAIDrugAI

编辑 | 王建民

今天给大家介绍俄亥俄州立大学计算机科学与工程系的Ruoqi Liu等人于2021年1月4号发表在Nature Intelligence machine上的一篇文章:A deep learning framework for drug repurposing via emulating clinical trials on real-world patient data. 在这项研究中,作者遵循随机临床试验设计的方案,并通过使用真实世界数据明确模拟相应的临床试验,通过计算筛选出候选药物以获得有益效果。考虑到真实世界数据的固有特征(即时间序列数据和现有的混淆变量),作者用深度学习和因果推理方法来控制真实世界数据中的混淆因素,并系统地评估药物对各种疾病疗效的影响。

1

研究背景

药物再利用是一种确定现有药物的新用途有效策略,并提供从实验到临床的最快转换。如电子健康记录的真实数据可提供有关许多药物使用者的信息。在这项工作中,作者提供了一个有效的框架,该框架可使用对现实世界数据的回顾性分析来生成和测试多个候选药物用于再利用。基于完善的因果推理和深度学习方法,本文的框架可对大型医疗索赔数据库中存在的药物进行随机临床试验仿真,并且在数百万患者的冠状动脉疾病队列中展示了本文的框架。作者成功地找到了可以显著改善冠状动脉疾病疗效的药物和药物组合,尽管尚未被指定用于治疗冠状动脉疾病,但这为药物重新利用铺平了道路。

2

模型框架

作者开发了一条高通量的计算用药通道(图1),该通道在给定疾病队列(例如冠状动脉疾病(CAD)患者)的情况下,提取了潜在的用药药物成分列表,并针对每种成分确定了相应的用户和非用户子队列。然后,它为两个子队列中的所有患者计算大量特征(混杂因素)以及疾病进展结果。用深度学习框架纠正混淆和选择偏见后,可评估治疗效果(图2)。该框架配备了一个注意机制,可为模型提供可解释性。具有统计学上显着有益作用的药物成分将被视为重新定位的候选药物,并被建议作为CAD的治疗方法。

图1. 药物利用框架流程图

图2. 用于预测治疗概率(或倾向评分)的深度学习模型的插图,本文用它来纠正时序数据(包括诊断dt,处方pt和人数统计bt)中的混淆。

总的来说,在这项研究中,作者遵循随机临床试验(RCT)设计的方案,并通过使用RWD明确模拟相应的临床试验,通过计算筛选出重新筛选候选药物以获得有益效果。考虑到RWD的固有特征(即时间序列数据和现有的混淆变量),作者应用深度学习和因果推理方法来控制RWD中的混淆因素,并系统地评估药物对各种疾病结局的影响。具体而言,在MarketScan索赔数据上,通过长期短期记忆(LSTM)和治疗加权比值的逆向概率(IPTW)获得了估计的药物作用。作为测试案例,作者将拟议的药物用途框架应用于数百万患者的冠状动脉疾病(CAD)队列,并模拟多个候选药物的RCT,以评估其对CAD进展结果的影响。这篇文章的贡献有以下几个方面:

  • 作者通过模拟每种药物的RCT(评估其有益效果),开发出一种高通量筛选市售药物的框架。 这样就可以从现有的大规模生产中主动生成重新定位的候选药物 RWD。
  • 作者提出了一种创新的研究设计,可以根据纵向观察数据估算药物的作用。 CAD队列是在本文的框架下自动派生的,从而加快了药物计算的用途。
  • 作者提出了一种基于深度学习的倾向得分估计模型,以纠正混淆和选择偏见。 与基于逻辑回归的倾向得分估计模型的实验比较表明,本文提出的深度学习模型有效地估计了RWD产生的药物作用,为药物重新利用铺平了道路。
  • 作者评估药物组合,药物级别的候选药物对疾病结果的治疗效果,并进一步探索具有不同模型参数的潜在再利用机会。 本文还将作者的框架与三种现有的临床前药物再利用方法进行了比较,从而得出了令人满意的结果。

3

结果

3.1 性能优于重定位候选药物

从数据中获得的合格药物中,有四种是已知的CAD治疗方法:氨氯地平,地尔硫卓,替格瑞洛和瑞舒伐他汀(药物标签信息是从SIDER和DrugBank中获取)。本文的框架成功检索了其中三种已知药物:氨氯地平,地尔硫卓和瑞舒伐他汀。在图3中展示了估计的ATE分布。这项研究显示了经过重新加权和具有统计意义的估计值(调整后的p-value)后,具有平衡的用户和非用户子队列的候选药物。根据递增的估计ATE值,将所有药物从左到右排序。根据ATE的定义(即使用者和非使用者观察到的结果的加权平均值),将ATE值小于0的药物成分识别为改善疾病预后,而将ATE的药物成分识别为改善疾病预后大于0的值被认为会使疾病的后果恶化。对于具有有益效果的药物,作者将带有已知CAD标记的药物涂成红色,将没有CAD的药物涂成蓝色。从结果中可以观察到9种药物对16种选定的重要药物候选者的疾病疗效产生了有益的影响。具体而言,根据其药物标签信息,只有3种用于CAD,其余六种药物(尚未指定用于治疗CAD但可以改善疾病预后)被视为重新定位的候选药物。

图3. 在50个bootstrap样本中,按定义的结果估计的药物ATE分布。

3.2 注意力可视化案例研究

在证明了本文的模型成功识别了用于CAD治疗的候选药物后,作者进一步证明了本文的框架通过注意机制实现的可解释性。为了举例说明这一点,作者选择了两种候选病例药物:地尔硫卓和非诺贝特。根据表1,地尔硫卓和非诺贝特对冠心病预后均有有益影响。地尔硫卓已经被用于治疗CAD,而非诺贝特在其药物标签上没有CAD适应症。

表1. 对冠心病的治疗效果的估计超过平衡和统计显著的药物成分

作者想要确定原始数据中用户和非用户组之间有很大偏差,但在重新加权后达到平衡的协变量。所学习的注意力权重使得可以在用户和非用户组之间进行平衡之前/之后可视化每个协变量及其SMD值。作者选择前20个平衡良好的变量(即平衡过程中SMD的较大偏差)协变量,并在图4中绘制了两种病例药物的SMD值分布。原始未加权数据表示为蓝点,而LSTM加权数据表示为橙色点。根据未加权数据的SMD值和LSTM加权数据的差值的增加,协变量从下到上排序。

图4. 前20个平衡良好的协变量的SMD值。

4

总结

总而言之,作者证明了拟议的药物重用框架可以成功地识别对疾病结局具有有益作用但尚未针对CAD患者的候选药物。所提出的LSTM-IPTW模型在纠正偏差和估计治疗效果方面比LR-IPTW更好,并且保留了可识别重要混淆的可解释性。作者还评估了药物组合,药物类别的候选物对疾病结果的治疗效果,并进一步探索了使用不同模型参数的潜在再利用机会。此外,作者将他们的框架与三种现有的临床前药物再利用方法进行了比较,作者的框架优于其他框架。

数据和代码

https://github.com/ruoqi-liu/DeepIPW

参考资料

Liu, R., Wei, L. & Zhang, P. A deep learning framework for drug repurposing via emulating clinical trials on real-world patient data. Nat Mach Intell (2021).

https://doi.org/10.1038/s42256-020-00276-w

本文参与?腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-01-08,如有侵权请联系?cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与?腾讯云自媒体分享计划? ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
http://www.vxiaotou.com