前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >重磅综述:精准精神病学机器学习的现代观点

重磅综述:精准精神病学机器学习的现代观点

原创
作者头像
悦影科技
发布2023-02-05 10:20:00
2.1K0
发布2023-02-05 10:20:00
举报

1. 全局

在美国和世界各地,心理健康问题是一种流行病,给医疗保健系统和社会带来了巨大的负担。迄今为止,仍然缺乏生物标志物和个体化治疗指南。近年来,机器学习(ML)和人工智能(AI)在分析精神病学的神经和行为数据的复杂模式方面越来越受欢迎。我们提供了一个全面的回顾ML方法和应用在精准精神病学。我们认为,以ML为动力的现代技术的进步将在当前对精神疾病的诊断、预后、监测和治疗的实践中创造一个范式转变。我们讨论了精准精神病学的概念和实际挑战,并强调了未来的研究方向。

2. 摘要

根据美国国家精神健康研究所(NIMH)的研究领域标准(RDoC),功能神经成像的出现、新技术和方法的出现为开发精确和个性化的预后和精神障碍的诊断提供了新的机会。机器学习(ML)和人工智能(AI)技术在精准精神病学的新时代发挥着越来越重要的作用。将ML/AI与神经调节技术相结合,有可能为临床实践和有效的治疗提供可解释的解决方案。先进的可穿戴和移动技术也要求ML/AI在移动心理健康中的数字表型方面的新作用。在这篇综述中,我们通过结合神经成像、神经调节和先进的移动技术在精神病学实践中,提供了一个关于ML方法和应用的全面综述。我们进一步回顾了ML在精准精神病学中的分子表型和跨物种生物标志物鉴定中的作用。我们还讨论了可解释的人工智能(XAI)和神经系统的调节,并强调了ML在多媒体信息提取和多模态数据融合中的潜力。最后,我们讨论了精准精神病学的概念和实际挑战,并强调了未来研究的方向。

3. 引言

心理健康问题在美国和世界各地都是一种流行病。根据美国国家心理健康研究所(NIMH)的数据,近五分之一的美国成年人患有某种形式的精神疾病或精神障碍。根据美国疾病控制和预防中心(CDC)的数据,COVID-19大流行对我们的生活方式产生了重大影响,并显著提高了由恐惧、担忧和不确定性造成的不良心理健康状况。在成人和青少年中都观察到自杀率、阿片类药物滥用和抗抑郁药物使用的增加。心理健康的诊断和治疗给医疗保健系统和社会带来了负担。仅在美国,仅抑郁症的经济负担每年就至少有2100亿美元。精准医疗(或个性化医疗)是一种创新的方法,可以定制疾病的预防、诊断和治疗,可以解释受试者的基因、环境和生活方式的差异。精准医疗的目标是针对个体化患者的健康问题进行及时、准确的诊断/预后/治疗,并进一步为患者和替代决策者提供反馈信息。近几十年来,精准医疗取得了不同程度的成功,特别是在肿瘤学方面。传统的精神疾病诊断依赖于身体检查、实验室测试以及心理和行为评估。与此同时,精准精神病学也越来越受到应有的关注。虽然精神病学尚未充分受益于对其他临床专业产生影响的先进诊断和治疗技术,但这些技术有潜力改变未来的精神病学前景。

NIMH的研究领域标准(RDoC)倡议旨在解决精神疾病的异质性,并提供一个基于生物学(而不是基于症状)的框架来理解这些精神疾病在心理或神经生物学系统中不同程度的功能障碍;它试图连接多学科(如遗传学、神经科学和行为科学)研究方法的力量。当前的黄金标准诊断和治疗结果在精神障碍的诊断和统计手册(DSM),由美国精神病学协会(APA)通常是基于临床医生的观察,行为症状和病人报告,都容易受到高度的可变性。因此,在考虑精神障碍的异质性和共病的同时,必须开发定量的神经生物学标记物。

神经精神病学研究的一个重要目标是确定神经生物学/神经生理学发现和临床行为/自我报告观察之间的关系。机器学习(ML)和人工智能(AI)由于其强大的预测能力和对预后和诊断应用的泛化能力,在精神病学中引起了越来越多的兴趣。在过去的20年里,ML/AI在精神病学中的应用的兴趣稳步增长,这反映在PubMed的出版物数量上(图1A)。为了利用数字技术改善心理健康结果,所谓的“数字精神病学”侧重于开发用于评估、诊断和治疗心理健康问题的ML/AI方法。最近的一项全球调查显示,精神病医生对人工智能能否取代人类的同理心有些怀疑,但许多人预测,“人和机器”将越来越多地合作进行临床决策,精神病医生乐观地认为,人工智能可能会提高效率、获得精神护理,并降低成本。

在过去的二十年里,ML在精神病学文献中的应用大幅增长,反映在许多应用和综述中。虽然精神病学ML的有很多综述文献,但大多数综述仅限于相对狭窄的范围。在本文中,我们试图提供一个全面的回顾ML和ML驱动的技术在心理健康的应用。我们的观点是“现代的”,因为新技术的发展、消费者市场需求和公共卫生危机(如COVID-19)不断地重新定义了ML的作用,并重塑了我们在精确精神病学中的思维。具体来说,我们将涵盖在ML、多模态神经成像、大规模神经回来建模、神经调制和人机界面等方面的最先进的方法发展。由于空间的限制,我们回顾的文献绝不是详尽的。为了将我们的综述与其他综述区分开来,我们将重点关注精神病学中ML应用的几个核心问题:可概括性、可解释性、因果关系以及临床和行为整合。

我们对这一新兴领域的看法是谨慎乐观的,原因有几个。首先,随着数据量和计算能力的不断增加,精神科医生使用ML来重新评估临床、行为和神经成像数据的需求也越来越大。该行业对心理健康资金的兴趣也大幅增长(图1B)。其次,利用ML的力量和开发可解释的AI(XAI)工具来进行无偏不倚的风险诊断、个性化的药物推荐和精确的神经刺激正变得越来越重要。ML与神经影像学的整合可能会帮助我们在诊断中识别和验证生物标志物以及对精神疾病的治疗。第三,美国对精神病医生的需求不断增长,而较贫穷国家的短缺甚至更为严重。ML/AI技术可能会改变临床医生和患者的精神病学实践。最后,社交媒体、多媒体、移动和可穿戴设备等先进技术也需要开发ML/AI工具,以帮助评估、诊断或治疗有精神疾病或有风险的个体。在我们目前的综述中,ML和AI的意义相对广泛,通常涵盖了广泛的旨在寻找数据结构或规律性的分析或预测工具;因此,我们讨论的ML还包括数据挖掘和知识发现。从现在开始,我们将在整个论文中交替使用ML和AI。

4. 神经影像学背景

4.1 神经影像学进展

神经成像提供了一个从结构和功能形式来探测人类大脑的窗口,并提供了各种分辨率,以在宏观、介观和微观尺度上检查空间和时间域上的大脑活动(图1C)。

图片
图片

图1. 心理健康与神经成像分类中的ML研究。(A)标题或摘要中包含关键词“机器学习或人工智能”和“精神病学或精神健康”的PubMed出版物的数量(2000-2021年)。(B)在美国市场的心理健康技术资金的增长。(C)不同空间和时间分辨率的人类神经成像。

在过去的几十年里,我们对大脑和行为关系的理解呈指数级增长。虽然这种改善可能归因于多种因素,但神经影像学的进步发挥了突出的作用。从结构神经成像技术的日益普及,到功能神经成像可用性的增加所带来的重大科学进步,这些技术为提高对神经相关性的理解和对精神疾病中的生物标志物的发现提供了显著的好处。一些最常见的神经成像方法包括使用磁共振成像(MRI)、弥散MRI(dMRI)、功能MRI(fMRI)、脑电图(EEG)、脑磁图(MEG)、皮质电图(ECoG)、功能近红外光谱(fNIRS)和正电子发射断层扫描(PET)。到目前为止,脑电图和功能磁共振成像是精准精神病学的两种最常用的成像方式。具体来说,脑电图成本低,操作方便,对临床实践或家庭使用更有吸引力。

4.2 神经影像学分析

这些丰富的神经成像方式使我们能够全面地探测大脑功能。大量的研究努力已经致力于揭示使用先进的神经成像分析的各种精神疾病的神经生物学基础。在专门设计的认知范式下,任务相关的神经成像允许我们检查大脑活动(例如,事件相关的潜能和光谱扰动和奖励或情绪处理相关的功能激活)和认知功能障碍之间的关系。利用神经成像技术探索大脑功能的一个很有前途的方向是研究大脑连接(或connectome)。研究静息态的大脑连接体提供了一种优雅的方法来表征复杂的大脑结构和揭示内在大脑网络中的大脑功能障碍。越来越多的神经影像学研究表明,在整个数据收集过程中,功能连接可能会波动,而不是静止的。研究大脑网络的时空动态的研究最近受到了越来越多的关注,并可能揭示与不同精神疾病相关的有意义的大脑状态。为精神病学建立强大的生物标记物的另一种有前途的方法是以数据驱动的方式结合多种神经成像模式,这为利用单一模态方法可能无法捕获的跨模态互补信息提供了机会。

4.3 特征工程

输入数据包括提供给ML算法的特征。所有ML方法将受益于适当的特性工程(包括但不限于估算,比例、标准化,规范化,转换,和独热编码)。将知识驱动特性工程分析特定的神经成像模式显示出重要的希望提高模型性能及其生理可解释性。例如,空间滤波(或源定位),然后对得到的时间序列进行正交化,并计算它们的功率谱相关性,可以减轻体积传导和源泄漏的影响,从而可以更准确地量化脑电图或脑磁图中的功能连接。

为了充分理解大脑的结构和功能组织,我们认为,当神经成像与现代ML和其他ML动力技术相结合时,可以为推进精神疾病的诊断、预后和干预提供强有力的工具。

5. ML如何帮助精神病学?

5.1 精神病学与其他医学学科的比较

精神疾病的性质和病因尚不清楚,而且有待研究还具有挑战性。传统的精神疾病神经生物学研究遵循了一个分类框架,采用病例-对照设计,将所有给定诊断的患者与健康个体进行比较。基于症状的诊断涵盖了数十万种不同的症状组合,这导致了广泛的临床异质性。越来越多的人认识到,现有的临床诊断类别可能会歪曲潜在的精神障碍的原因。在缺乏差异诊断特异性的情况下,传统的病例-对照设计往往无法匹配临床有用的决策过程,这是由于它在描述精神疾病的显著临床和神经生物学异质性方面的优势有限。另一方面,先前的研究已经广泛地探索了神经生物学的群体效应,以解释其与行为和疾病的联系。然而,这种群体水平的分析并不能完全捕捉到个体水平的大脑异常,而这对开发个性化医学至关重要。

此外,许多精神疾病可能被认为是沿着多个维度下降的。多种精神疾病的同时发生可能反映了由共同的危险因素和可能相同的潜在疾病过程所导致的不同的症状模式。这些疾病的高共病性显著影响根据传统诊断类别的精神病理学特征。因此,专注于单一诊断领域的传统研究不足以揭示多种疾病之间共病的神经相关性,或识别神经回路和行为表型的维度。

5.2 临床需求驱动ML应用于心理健康

尽管精神病学研究取得了快速进展,但有几个领域的研究似乎还不够充分,但可能在精确精神病学方面实现重大突破方面具有巨大潜力。首先,剖析个体间和个体内部变异的能力对于理解人类认知和行为变异的神经基础至关重要。关注个人水平的研究可能比传统的群体水平分析获得更大的成功。以转化研究为导向的精神神经成像方法可能进一步提高发现可用于个体的统计学显著效应量的能力。

第二,识别精神疾病的亚组(即亚型)可能会描述疾病的异质性。越来越多的证据表明,数据驱动的分型可能驱动与独特的行为和认知功能相关的新的神经生物学表型。这些分层表型可能有助于提高临床结果的可预测性,并可作为治疗选择的潜在生物标志物。然而,亚型分析被广泛认为是产生假设的分析,并对再现性和生理可解释性提出了重大挑战。使用精心设计良好的ML方法将亚型识别与特定结果或问题联系起来对于解决这些挑战至关重要。

第三,另一个有前途的领域专注于跨诊断方法,以揭示特定领域(如认知、觉醒和情绪调节)的神经相关,这些领域涉及整个诊断谱的精神病理。最近的ML研究致力于识别跨诊断性脑功能障碍和精神病理学的维度,以提高对精神疾病共病的理解。重要的是,从纵向的角度利用“大数据”提供了一种很有前途的方法来追踪神经生物学和表型轨迹,而这在以前的横断面精神病学研究中很少被检验。最终,这些纵向研究可能有助于揭示疾病进展背后的神经机制,并为发展及时的干预措施提供新的见解。

值得注意的是,混淆效应的存在是精神病学研究中最关键的挑战之一。例如,站点效应或不匹配的表型信息(例如,人口统计学和临床测量)可能会扭曲输入特征和输出之间的明显关系。药物治疗也被发现会强烈地改变大脑的活动和连接。因此,不恰当地建模这些混杂因素可能会导致错误的发现。迄今为止,已经进行了心理健康研究来控制混杂因素对生物标志物定量的影响。

表1中总结的ML方法可以大大赋予这些研究精神疾病的新前沿力量。这些应用包括将患者分为有临床意义的亚型,发现新的跨诊断疾病维度,并为个别患者量身定制治疗决策。总之,这些研究成果可以为促进基于客观生物标志物的精确精神病学的发展带来重要的前景。

表1. ML的类别、概念、典型方法及其具有代表性的应用程序

ML在精神病学中的应用主要可以根据其临床目的进行分类:诊断、预后、治疗和再入院。与大多数医学学科相比,精神病学的传统诊断仍然局限于主观症状和可观察到的体征,因此需要进行范式转变。ML提供了一种新的范式来实现自动化和更客观的评估各种精神疾病。对于疾病诊断,监督分类可用于识别有区别的生物标志物,以区分特定的疾病与健康状况或其他精神疾病。无监督聚类有助于识别疾病亚型,以解剖临床和生物学上的异质性,从而提供了定义精神疾病的新方法。对于疾病预后,可以建立分类模型来区分不同的病程轨迹(例如,进展者和非进展者),而回归模型可用于预测疾病过程中的症状发展。在治疗研究中,个体对治疗的反应可以使用分类方法来区分有应答者和无反应者。基于回归的方法也可以用来预测治疗后症状的变化。对于再入院评估,监督分类可用于预测个体是否会再次住院或检测复发轨迹。通过适当设计的策略,特征缩减/映射方法和知识驱动的特征工程可以集成到ML模型训练中,以识别信息更丰富和可解释的生物标记模式。

需要注意的是,ML是一个不断增长的大型学科,它涵盖了许多类别和突发主题,每个主题都有不同的技术焦点。ML的标准分类通常包括有监督、无监督和强化学习范式。也有各种各样的扩展或特殊的处理每个类别或组合(例如,半监督学习、核学习、集成学习、深度学习;见图2)。在这里,我们审查特定的ML方法的基本原理仅仅是基于它们在现有的心理健康应用程序中的适用性。

图片
图片

图2. 针对心理健康应用程序的各种ML模型。(A)左:多模态监督分类方案。在训练数据上优化了三个特定于模态的因素:分类器类型、参数和权重。最终的诊断分类是基于决策值的加权和,其中的权重对应于在训练期间估计的权重。右图:功能神经成像模式的特征重要性图。(B)无监督学习。左图:所有被试的全脑功能连接矩阵的平均值。Z to fisher变换相关系数。右:层次聚类分析。基于电子病历的表型分层的(C)半监督学习管道。(D)深度神经网络(DNNs)用于群体水平和个体化治疗预测。未来的数据点可以用于预测症状发作、治疗反应或其他心理健康相关变量。

在下面的小节中,我们将回顾基于神经成像、行为和临床测量的心理健康应用中的几个关键的ML范式。对代表性应用程序的表格审查如表2所示。具体来说,我们将关注基于神经成像的精神病学研究的回顾,而其他数据领域(如遗传、临床、行为和社交媒体数据)的详细回顾将在后面的章节中介绍。为了空间限制,我们将不会在本节中包括对所有ML范式(如强化学习、主动学习和迁移学习)的详尽回顾,而是在必要时提供一些参考指针。

表2. 基于神经影像学和临床数据的精神病学代表性ML应用

图片
图片

5.3 有监督的和无监督的学习

ML在促进从小的病例对照研究到那些具有大的经诊断样本的研究,以及从先前指定的脑区到全脑回路功能障碍的研究方面具有巨大的前景。在针对个体患者的循证精神病学的新时代,客观可测量的内表型可以允许早期疾病检测、个性化治疗选择和剂量调整,以减少疾病负担。这些有前途的应用在精神疾病已经通过利用现代ML技术的强大力量。

5.3.1 有监督的学习

有监督的学习是最常用的ML类别,已被广泛应用于基于神经成像的精神疾病预测建模任务。经典的监督学习算法包括逻辑回归、支持向量机(SVM)和随机森林。考虑到神经成像数据的高维性质,这些方法通常伴随着一个特征选择步骤来获得低维表示。基于连接体的预测建模是一种结合简单线性回归和特征选择的方法,从连接数据中预测性状和行为的个体差异。最小绝对收缩和选择算子(LASSO)提供了一种替代方法,同时执行特征选择和预测,以学习一个紧凑的特征模式,以准确预测特定的疾病或临床结果。相关性向量机(RVM)建立在一个概率框架之上,利用自动相关性确定来学习一个稀疏的解决方案,并惩罚不必要的模型复杂性。RVM最近在量化创伤后应激障碍(PTSD)诊断的神经成像生物标志物以及抑郁症的治疗结果预测方面显示出了它的优势。作为传统单任务方法的扩展,多任务学习(MTL)方法已被越来越多地应用于从神经成像数据的多个视图中共同利用互补特征。

由于大脑功能的复杂性,在原始的高维特征空间中可能无法观察到信息性特征。为了解决这一挑战,潜在空间的监督学习已经被开发,以揭示精神障碍中神经回路的潜在维度。例如,一种针对脑电图数据的稀疏潜在空间回归算法被开发出来识别抑郁症患者的抗抑郁反应性大脑特征。通过在凸优化框架下联合估计空间滤波器和回归权值,ML模型能够成功地揭示低维潜在空间中的治疗预测特征。为了解决精神疾病之间的共病问题,已经开发了使用能够发现高维数据集之间复杂线性关系的统计模型的维度方法。例如,通过将典型相关分析(CCA)应用于静息态fMRI(rsfMRI)连接和临床症状,已经成功地识别出了抑郁症相关连接特征的低维表征。所发现的表征定义了两个疾病维度,分别对应于快感缺乏症相关成分和焦虑相关成分。一个类似的维度分析也被用来检查痴呆症中神经精神症状的神经相关性。使用CCA,两种潜在模式具有不同的神经解剖学基础的共同和情绪特异性因素的症状。一种稀疏CCA方法已被应用于揭示精神疾病的精神网络的精神病理和功能连接的相关维度。这种方法成功地确定了可解释的维度,包括情绪、精神病、恐惧和外化行为,所有这些都引导了整个临床诊断谱系的神经回路模式。偏最小二乘(PLS)方法也被应用于识别潜在的成分连接一套广泛的行为措施与功能连接。潜在成分定义了具有可分离的脑功能特征的不同维度,并提供了跨越诊断类别的潜在中间表型。这些维度分析在发现新的跨诊断表型,以发展有针对性的干预措施方面有很大的希望。

5.3.2 集成学习

虽然ML方法已经被广泛地设计用于监督学习,但使用一个单一的模型可能不能为一个复杂的预测任务产生最优的泛化性能。通过结合多个ML模型来减少方差,集成学习在预测方面优于单一模型,并且在被证明发现精神疾病的稳健生物标志物方面是成功的。例如,多图谱集成学习算法已被提出用于改善精神分裂症检测和自闭症谱系障碍(ASD)的诊断。利用包括sMRI、fMRI和DTI在内的多模态神经成像,基于bagging的SVM在预测儿童期注意缺陷多动障碍(ADHD)的成人预后方面取得了显著改善。基于选择性集成算法,设计了一个稀疏多视图预测模型,并将rs-fMRI连接用于ASD诊断;该模型在引导框架下结合了多个分类器,并显著优于其他单模型方法。

虽然复杂的监督学习模型通常会产生更好的分类或预测性能,但它们的可解释性以增加模型复杂性为代价而降低。我们将在稍后更详细地讨论可解释的ML方法(精神病学中的XAI)。此外,标记数据需要真实知识,在精神障碍的情况下,这并不总是准确或可靠的。例如,皮肤癌的诊断可能依赖于经过活检和编目的训练样本,毫无疑问它们是否恶性;然而,没有等同于精神障碍的活检。

5.3.3 无监督的学习

无监督的学习放松了标记样本的假设,可以很有用,例如,对于探索性数据分析、特征工程或聚类分析。无监督学习的目的是通过识别潜在的聚类(例如,使用潜在的类分析或K-means聚类)或学习满足特定标准的特征映射(例如,使用主成分分析[PCA])来揭示内在的数据结构。识别患者亚型提供了一个很有前途的策略来描述精神疾病的神经生物学异质性。利用rs-fMRI,应用层次聚类成功识别了抑郁症患者功能连通性的四种亚型。这些亚型被发现与不同的临床症状谱相关,并预测对脑刺激治疗的反应性。从rsEEG中,使用具有不同功率谱连接模式的稀疏K-means聚类确定了两种跨诊断亚型,并发现它们对抗抑郁药物和心理治疗有不同的反应。作为一种基于非距离概率的聚类方法,潜在类分析也被应用于发现精神疾病的亚群。一项概念验证研究使用潜在类别分析进行了一项研究,从fMRI激活谱中识别ADHD亚型,并发现大脑活动减弱的亚型在日常生活中表现出更少的行为问题。通过利用来自多个时间点的数据资源,精神病学研究已经从横断面分析转向纵向建模。有限混合建模在纵向重复测量数据的分析中越来越流行,它可以识别遵循类似时间发展路径的潜在类别。典型的有限混合模型包括生长混合模型、基于群的轨迹建模和潜在跃迁分析。潜在生长混合模型(LGMM)和基于群体的轨迹模型在研究抑郁、焦虑和ASD等精神障碍中变得越来越流行。它们提供了一种灵活的方法来识别表现出异质性症状轨迹的潜在亚群。LGMM方法也已成功用于预测高危人群中的创伤后应激障碍病程。作为潜在类别分析(LCA)对纵向数据的扩展,潜在过渡分析(LTA)可以预测物质使用障碍(SUD)个体的纵向服务使用。这些方法共同提供了强有力的工具来描述精神障碍过程中相应的纵向异质性和相应的独特表型。

5.3.4 半监督的学习

半监督学习是一种结合了有监督学习和无监督学习的ML方法。流行的半监督学习技术包括自训练、混合模型、共训练和多视图学习、基于图的方法和半监督聚类。这些方法已越来越多地应用于精神病学研究。通过统一自动编码器和分类,建立了ASD诊断的半监督模型。利用图卷积网络设计了一种半监督分类方法,并应用于基于总体图的ASD诊断。还设计了一种半监督聚类,利用凸多聚类驱动扩展SVM隐式聚类,通过判别分析形成一种称为异质性的方法,可以实现联合疾病分型和诊断。这种方法在描述双相和重度抑郁症(MDDs)和精神分裂症以及有内化症状的青少年的神经结构异质性方面显示出了优势。此外,半监督学习在来自电子健康记录(EHR)、社交媒体和手机的数字数据中获得了越来越多的心理健康应用。

5.3.5 规范建模

规范建模是一个新兴的和创新的框架,用于映射单个被试层面上与参考模型相关的个体差异。它已被越来越多地用于心理健康,通过量化个体偏差来分析实质性的神经生物学异质性。通过在大规模健康人群中建立神经成像数据的规范模型,可以通过检查个体患者的大脑异常与规范分布的统计差异来量化。基于高斯过程(GP)回归的规范模型已被用于量化各种精神疾病的个体偏差和解剖神经生物学异质性。有了这个工具,我们成功地发现了精神病理学的经诊断维度和个体在大脑结构中与正常神经发育的独特偏差之间的联系。通过结合基于耐受区间的规范建模和聚类分析,对rs-fMRI的个体异常进行准确量化,以确定PTSD患者的两种稳定亚型。与健康人群相比,这两种亚型表现出不同的功能连接模式,并且在临床再体验症状水平上有所不同。这些新的数据驱动的方法提供了有用的技术来识别患者的“异常”亚型,从而推进精神疾病的临床和机制研究。最近,一种自动编码器模型已被用于实现检测微观结构偏差的规范建模。

5.4 深度学习

深度学习由一系列使用多层体系结构人工神经网络的方法组成的ML任务。通过专门设计的深度神经网络结构,可以从原始特征中学习到高级的特征表示。因此,深度学习有望为疾病诊断和预测提供一个端到端分析框架。随着神经成像技术的发展,越来越多的大规模多中心数据集被建立,用于建立强大的ML模型,充分探索复杂大脑和基因组数据的信息特征表示。通过在这些大规模数据集上进行训练,深度学习可以学习鲁棒的神经成像表示,并在心理健康的各种应用场景中优于标准的ML方法。

5.4.1 深度自编码器

深度自动编码器,也被称为堆叠自动编码器(SAE),其目的是通过编码器学习输入数据的潜在表示,并使用这些表示通过解码器重构输出数据。通过叠加多层自动编码器,形成了一个深度自动编码器,以发现更复杂和潜在的非线性特征模式。深度自编码器已被应用于从功能磁共振成像的低频波动振幅中提取低维特征。利用深度自动编码器发现的潜在特征进行聚类分析,进一步确定了主要精神疾病中的两种亚型,包括精神分裂症、双相情感障碍和MDD。同时设计了一个基于稀疏SAE的深度学习模型,并应用于降低fMRI连接的维数。在该模型中使用的稀疏性约束产生了可解释的神经模式来改进ASD诊断。深度自动编码器也被用于实现结构MRI的规范建模,用于量化神经精神疾病的个体异常,包括精神分裂症和ASD。与传统的病例-对照分析相比,使用规范模型提取的异常特征,提高了诊断性能。最近,一种深度对比变分自动编码器被用来从MRI数据中提取神经解剖学特征,以识别可归因于ASD而不是个体变异的其他原因的大脑功能障碍。

5.4.2 卷积神经网络(CNNs)

与传统的多层感知器或自动编码器为每个输入特征分配不同的权重不同,CNN的设计是为了更好地从像素或体素中捕获空间和局部结构信息。由于其利用邻域信息学习特征层次结构的优势,CNN已成为各种医学应用中最成功的深度学习模型之一。通过基于脑电图的图像构建,结合CNN建立诊断模型,以准确检测MDD。该模型提供了一个端到端框架,可以成功地从rs-EEG中识别翻译生物标志物,以区分抑郁症患者和健康人。利用全脑结构MRI,还设计了一个三维(3D)CNN模型,自动提取多层高维特征,用于行为障碍的诊断。

5.4.3 图神经网络(GNNs)

虽然深度学习模型在捕捉复杂的神经成像模式方面显示出了优势,但它们可能不能很好地推广到非欧几里得数据类型(如大脑网络)。相比之下,GNN提供了一种学习非欧几里得数据的深度图结构的聪明方法,从而提高了在各种网络神经科学任务中的性能。例如,已经设计了一个基于图卷积网络(GCNs)的框架,用于ASD的诊断。通过建立一个将rs-fMRI数据作为节点特征和表型测量作为边缘的群体图,设计的模型优于其他最先进的方法。我们还设计了一种诱导GNN模型来嵌入包含任务功能磁共振成像不同属性的图表,并驱动可解释的连接体生物标记物用于ASD检测。最近,一种新的GNN模型被开发出来,将动态图计算和邻居节点的特征聚合结合到图卷积中,用于脑网络建模。这种动态GNN显著改善了ADHD的诊断表现,并揭示了连接体异常和症状严重程度之间的回路水平关联。

5.4.4 递归神经网络(RNNs)

作为前馈神经网络的一种特殊扩展,RNN具有从序列数据和时间序列数据中学习特征和长期依赖关系的能力。长短期记忆(LSTM)模型是最流行的RNN,在各种精神疾病研究中捕捉神经成像数据的时间动态信息方面显示出优势。我们建立了一个基于LSTM的RNN架构,利用时间过程构建了与fMRI无关的组件,以利用时间信息,从而提高了精神分裂症的诊断。通过将RNN与其他深度神经网络相结合,人们还提出了新的ML模型来模拟神经成像数据中的时空动态。提出了一种用于fMRI四维建模的时空CNN模型,在默认模式网络中识别关键特征方面具有鲁棒性。LSTM也被应用于将多阶段神经成像数据纳入纵向分析框架,用于建模各种精神疾病的精神病理发展轨迹。最近利用脑磁图数据建立了一个基于LSTM的模型,以实现对病理脑状态的准确纵向跟踪和预测创伤后应激障碍的临床结果。

5.4.5 生成对抗网络(GANs)

作为一种生成模型,在计算机视觉和自然语言处理中得到了广泛的关注,在神经成像分析中也越来越受欢迎。GANs由两个相互竞争的神经网络组成(一个作为生成器,另一个作为鉴别器),可以在没有大量标记数据的情况下学习深度特征表示。由于这一独特的优势,GANs被越来越多地应用于数据增强,以增强模型训练的样本量。此外,GANs已被用于推断多模态数据集中的缺失值,这是精神病学研究中的一个常见问题,而不是丢弃一个完整的多变量数据点。对抗性模型也被纳入其他ML模型,用于精神病学研究的特定应用。例如,在LSTM中加入鉴别和生成成分,形成一种基于fMRI的MTL分类方法,与标准LSTM相比,这导致了改善ASD的诊断。通过将GANs与组独立成分分析(ICA)相结合,建立了一个基于功能连接的深度学习模型,用于诊断MDD和精神分裂症。具体来说,具有假连接性的生成器被训练成将鉴别器与中间层的真实连通性相匹配,而为发生器确定了一个新的目标损失,以提高诊断精度。最近,通过将GAN的概念纳入到模型训练中,设计了一个无混杂因素的深度学习框架。这种端到端方法能够同时学习信息特征和控制混杂效应,以提高模型性能。

深度学习算法的优势在于,它们可以学习复杂的预测-响应映射,但这种能力也是以需要非常大的样本量来进行模型优化为代价的。这在精神病学应用中提出了潜在的过拟合和可解释性的挑战。

5.5 精准精神病学的关键ML概念

不管精神病学应用中的ML范式如何,都有一些共同的被试将人类智能与自动或人在循环中的机器智能区分开来。在最近发表的白皮书《医疗保健中的机器智能》中,我们强调了ML系统的四个重要特性。这些概念广泛适用于精确精神病学。

1)可信度:在不同的输入和环境中访问一个ML派生输出的有效性和可靠性的能力。换句话说,精神科医生需要能够评估ML系统的局限性,并自信地将系统派生的信息应用于精神病学评估。

2)可解释性:理解和评估机器内部机制的能力。ML系统的开发将需要考虑数据质量、系统功能和影响的质量指标、环境中应用程序的标准以及系统的未来更新。

3)可用性:一个ML系统可以在多个环境中以有效性、效率和患者满意度来实现特定目标的程度。这些应用程序需要跨多个设置进行扩展,同时防止提供者和患者的额外负担。

4)透明度和公平性:了解和理解可能影响系统输出(临床决策支持)的输入方面的权利。这些因素应该适用于那些使用、规范并受到使用ML系统的任何类型的护理决策的影响的人。在做出决策之前,需要识别和告知数据或系统中的潜在偏差。

前两个特征与可解释性有关,我们将在精神病学的XAI中进行更详细的讨论。另外两个特性将在讨论和结论中进行讨论。

5.6 研究案例

为了帮助读者对ML技术在精神病学的应用中得到回顾的具体概念,在这里我们提出了几个案例研究来说明预测/分类诊断分析的优势。这些具有代表性的案例研究采用了不同的ML策略,并涵盖了不同的数据模式,包括rs-EEG、任务fMRI和ECoG。

5.6.1 研究案例1:稀疏潜在空间学习用于基于EEG的抑郁症治疗预测

与安慰剂相比,抗抑郁药仅表现出适度的优势,部分原因是MDD的临床诊断包括与治疗结果有差异相关的生物学异质性条件。重要的是要开发一种抗抑郁反应表型的强大的神经生物学特征,以决定哪些患者将从药物中获益。为了解决这一挑战,Wu等人开发了一个稀疏的脑电图潜在空间回归(SELSER)模型来预测治疗结果。具体来说,SELSER在凸优化框架下结合优化空间滤波器和回归权值,并识别出MDD的抗抑郁反应性脑电图特征(图3A)。它能准确预测抗抑郁药物的结果(n = 228)。通过对头皮空间模式的源映射,进一步观察到神经生理学上可解释的皮质模式,主要由右侧顶枕叶区域和外侧前额叶区域贡献(图3B)。对一个独立队列的验证显示,部分应答组与治疗耐药性组相比,由大脑签名预测的治疗结果显著更高,这表明其在抑郁症更广泛的治疗耐药性结构中具有进一步的临床效用。

5.6.2 研究案例2:基于无监督学习的精神疾病中神经生理学亚型的识别

神经生物学异质性对治疗结果的重大影响独立于治疗前的临床症状。例如,尽管心理疗法是目前治疗创伤后应激障碍最有效的方法,但许多患者仍然没有反应,与有反应的患者相比,大脑功能表现出差异。Zhangetans利用稀疏K-means开发了一个数据驱动框架,实现rs-EEG源重建信号的高维功率包络连通性的同时特征选择和分型。该方法成功地识别了创伤后应激障碍和MDD中具有不同功能连接模式的经诊断亚型(n = 648),它们在额顶控制网络和默认模式网络中存在显著差异(图3C)。重要的是,在症状严重程度的意向治疗意向分析中,线性混合模型显示,两种亚型对心理治疗和抗抑郁药物与安慰剂的反应存在差异。基于RVM的分类分析进一步证实,使用rs-fMRI连接可以区分脑电图连接驱动的亚型。从fMRI中识别出的鉴别模式也与脑电图连接模式相一致(图3D)。

图片
图片

图3.研究案例1和2中的概念和主要发现。(A)研究案例1中用于治疗结果预测的稀疏脑电图潜在空间回归(SELSER)框架的说明。(B)源自头皮模式的可解释皮层模式。(C)在创伤后应激障碍和MDD的研究案例2中,通过稀疏k均值识别独特的脑电图连接谱来定义精神疾病亚型。这两种确定的亚型被进一步发现可以预测对心理治疗和抗抑郁药物的治疗反应。(D)脑电图连接定义的亚类型可以通过基于RVM的分类器的rs-fMRI连接模式来区分。

5.6.3 研究案例3:基于恐惧消退学习任务的功能磁共振成像对焦虑和非焦虑大脑的分类

使用神经成像队列研究(304名成年人,92名焦虑患者,74名创伤暴露个体,138名健康控制组),Wen等人检查了10大脑区域的功能磁共振成像激活通常激活在恐惧条件反射和灭绝(图4)可能区分焦虑或创伤暴露的大脑控制。他们提出了一个CNN分类器(图4B)来将恐惧诱发的功能磁共振成像活动在空间和时间上映射到一个预测概率分数,表明被试属于焦虑的群体。在5倍交叉验证中,CNN获得了受试者工作特征曲线(AUC)下面积为0.84 ± 0.01,0.75 ± 0.03敏感性,0.77 ± 0.02特异性(图4C),优于其他ML方法(如SVM和随机森林)。预测得分也与对照组的焦虑敏感性指数(ASI)相关(图4D)。此外,我们还进行了对照分析来证明恐惧网络在辨别中的特异性(图4E)。

图片
图片

图4.研究案例3中的概念和主要发现的说明。(A)实验范式。(B)CNN的示意图。由CNN产生的(C) AUC曲线与概率水平相比。(D)预测得分正相关的焦虑敏感指数(ASI)对照组(r=0.41,p<0.001),但在焦虑的机会水平(E)分布基于大脑激活的10节点恐惧随机选择大脑区域。

5.6.4 研究案例4:从多部位颅内脑活动中解码情绪状态

Sani等人从颅内ECoG信号中,同时收集了7名癫痫患者的多日自我报告的情绪状态测量数据,开发了一个动态状态空间模型(SSM)框架来跟踪患者的情绪状态随时间的变化(图5A)。该建模框架由无监督的和有监督的学习组件组成(图5B)。从大脑边缘区的情绪预测网络中提取光谱空间特征。神经解码器也可以高度预测人群水平上的即时情绪标器(IMS)点。此外,同样的训练译码器可以用于跨小时和几天的情绪状态预测,并在广泛的IMS中进行推广。在交叉验证中,解码器可以预测IMS变化,在所有7个个体内,分别占总可能IMS范围的73%和33%的±为7.2%(图5C)。这些结果表明,基于ML的解码器可以预测患者在多日记录中大脑活动的情绪状态变化。

图片
图片

图5.研究案例4中的概念和主要发现的说明。(A)交叉验证示意图。一个IMS点(例如,SN)被遗漏,作为要预测的测试IMS。其他的IMS点(即训练IMS,使用S1到SN-1)和相关的神经活动在建模框架内用于训练神经编码模型。(B)基于无监督学习和有监督学习的建模框架的主要组件。(C)交叉验证的情绪状态预测显示与真实测量的情绪状态。

6. 精神病学的ML驱动技术

麦肯锡最近的一项研究表明,与 COVID 之前的基线相比,远程医疗的使用增加了 38 倍。随着远程治疗需求和消费的急剧增加,许多公司(例如 Talkspace 和 Headspace Health)提供的服务包括与获得许可的心理健康专业人员进行基于聊天的对话。今天远程治疗的定义已经扩展到包括这些更新的护理提供方式。医疗服务的这些进步使得能够定期收集大量文本、音频和视频数据,这在以前只能在受控研究环境中使用。此外,自然语言处理、语音和视频分析技术的最新进展与 ML 工具相结合,在这个新兴领域产生了许多创新。全球精神科医生社区越来越意识到这些发展。

机器学习可以应用于患者旅程的所有阶段:各种疾病的风险评估、诊断、预后、治疗和复发,其中分析可应用于自然语言、语音、面部表情、肢体语言和社交媒体,以及传统的临床调查和神经影像学数据。表3总结了最近的代表性研究,这些研究使用 ML 来支持患者旅程的各个阶段。应用 ML 可以构建针对每位患者优化的个性化模型,与仅针对群体效应进行优化的传统模型相反。此外,鉴于临床诊断和症状之间的疾病间和疾病内变异性,ML 方法(例如 MTL)可用于模拟疾病类别之间的鉴别诊断。所有这些提到的 ML 应用程序都可以被认为是第一级的精准精神病学。

表3. 多媒体数据在精神障碍中的代表性ML应用

图片
图片

但是,使用 ML 可以建模的精度远远超过第一级。在精神病学评估期间,精神病医生可能会尝试在大约30 分钟内建立一个关于患者生活中正在发生的事情的心理模型。他们的目标是在短时间内尽可能多地了解患者的病史,定义患者的“正常”状态,并识别与正常情况的偏差。这通常是通过向患者提问并检查他们的言语、肢体语言和行为反应来完成的。期望精神科医生在如此短的时间内建立一个准确的患者整个生命的基线模型,同时与处于妥协心理状态的患者互动,这是非常具有挑战性的,几乎是不现实的。ML 可以通过在每位患者就诊之前建立特定于他们的基线模型来提供帮助,并在检查期间提供各种观察结果的界限作为精神科医生的参考。这可以看作是二级精准精神病学(图6A)。以MDD 为例:图6 B 显示了如何在患者旅程的不同阶段应用ML。

图片
图片

图6. 精准精神病学的ML。(A)ML应用于心理健康的两个精度。(B)在MDD患者旅程中不同阶段的ML应用实例。

在以下小节中,我们将描述如何将 ML 应用于临床相关数据并支持患者旅程的一个或多个阶段。

6.1 移动和传感技术

智能手机、智能手表和其他可穿戴传感设备的发展使我们能够获得比以往更多的关于身心健康的信息。具体而言,有几种类型的信号与心理健康监测和评估相关(图7A):

1)行为和物理信号:位置(例如 GPS 坐标)、移动性(例如加速度计)。

2)多媒体信号:面部表情、说话模式。

3)社交信号:社交互动(例如,通话和短信日志)、通信模式、参与度、在线游戏。

4)生理信号:皮肤电导、心率变异性 (HRV)、眼球运动、皮肤电活动 (EDA)。

5)睡眠活动:睡眠持续时间、睡眠分期、手机开/关状态。

这些信号与精神疾病有不同的含义和相关性。虽然一个单一的信号可能不能表明精神障碍,但这些生理/生理/社会线索的结合可能揭示个人心理健康的重要线索。接下来,我们将重点分析多媒体、语言和社交媒体数据,以开发它们的心理健康应用程序。

6.2 语音和视频分析

迄今为止,声音和视觉(面部表情和身体语言行为的视频)数据在精神障碍的研究中得到了越来越多的关注。使用从诊所获得或远程访问的语音样本的ML技术可能有助于识别生物标志物,以改善诊断和治疗。从早期的实践开始,心理学家就已经使用听觉和视觉线索来帮助诊断精神疾病。此外,语音和视频不仅在传统的远程治疗环境中很容易获得,而且也很容易被解释为人类最自然的交流形式。

6.2.1 音频和语音功能

来自音频数据的声学特征已被发现与许多精神障碍相关,包括抑郁症、双相情感障碍和精神分裂症患者的言语分析。表4列出了在精神疾病分析中常用的一些声学特征。这些类别使ML分析语音数据的标准化和解释成为可能。

表4. 多模式数据特征及其在心理健康中的应用

图片
图片

基于语音的特征建立的模型可以有效地预测抑郁症和自杀倾向的诊断。抑郁症的应用包括预测其存在、严重程度和评分。这些模型使用从原始语音数据计算出的韵律、光谱或其他特征来量化奉语音、慢语音和其他相关标记。目标结果变量来自于一个临床有效的量表,如患者健康问卷(PHQ-9)。此外,探索类似特征的自杀倾向模型已被用于多类环境中,以区分健康、抑郁和有自杀倾向的言语。

在临床实践中应用基于语音的模型的一个关键挑战是在现实世界的环境中缺乏纵向数据验证。然而,这个问题开始在最近的研究中得到解决,研究从表示同意的参与者的电话录音中检测出躁狂和抑郁的言论。另一个挑战是缺乏大型标记数据集来评估不同方法的性能的数据集。为此,值得注意的是,像Ellipsis Health这样的公司已经使用深度学习和迁移学习来预测高精度的抑郁和焦虑得分。在一些商业应用中,仅使用20-30秒的音频剪辑来检测抑郁症。

6.2.2 视觉特征

虽然肢体语言和面部表情一直是精神病学检查的关键组成部分,但ML直到最近才被用于客观地分析这些数据。到目前为止,大多数研究都集中在自杀意念、抑郁症、精神分裂症、和ASD上。来自整体面部表情、眼睛、步态和姿势的特征(表4)已被证明与许多精神障碍相关。

对自杀意念的研究主要集中在使用可解释的ML来表征该障碍。这使得ML模型更适用于通过提出他们想要测量的特定见解来增强人类照顾者。在抑郁症研究中,一些方法也涉及融合来自每一帧的视频特征,这些特征用于训练顺序DNN,一些方法使用预训练来补偿相对较小的抑郁症数据集。虽然这些模型在同一卸载测试集上表现非常好,但由于缺乏可解释性,其临床应用仍然有限。为了提高可解释性,我们开发了抑郁激活图来突出ML模型学习到的抑郁严重程度对应的面部区域。同时,利用预定义的特性在提供可解释的结果方面是最有效的。

6.3 自然语言处理(NLP)

自然语言处理技术使计算机能够以类似于人类的方式分析、理解和从文本和语音中获得意义。NLP技术可以使心理健康专业人员能够评估语言模式,以帮助识别和预测精神疾病(表4)。语言不仅是人类行为的主要表达方式之一,它携带着与心理健康相关的各种内隐性和显性标记,而且与语言数据相比也更丰富。例如,社交媒体平台包含大量真实世界的语言数据,而语音数据很少是如此规模的。有两种类型的NLP应用程序用于检测特定的心理健康症状。第一种应用程序直接应用于患者数据,从预测自杀风险和早期精神病患者再入院到识别表型和共病。第二种应用电子病历和临床记录(测试、转录本),可用于自动图表审查,将患者聚类为表型亚型,并预测患者特定的结果。电子病历(包括病理报告、实验室结果、临床试验和临床会议记录)是纵向的、以患者为中心的临床记录的系统收集。患者的电子病历由结构化和非结构化数据组成。结构化数据包括关于患者的诊断、药物治疗和实验室检测结果的信息,而非结构化数据则包括以临床记录的形式提供的信息。

大量的EHR数据集提供了机会来调整ML方法,以跟踪和确定精神卫生保健质量改进的目标领域。根据2015年的一项全国性调查,61.3%的美国精神科医生使用电子病历。EHR语言至少从患者的症状中提取出一个层次,包括临床记录。然而,EHR数据的独特优势是易于与人口统计学和社会经济特征可以与语言数据相结合。来自电子病历中免费文本的症状已被用于预测双相情感障碍、情境攻击和自杀意念,并取得了与临床医生相当的表现。此外,电子病历中的出院总结也被用于预测复发。除症状外,还可以使用NLP方法从电子病历中常规提取各种相关的心理健康数据(如干预状态和身体健康共病)。关于EHR数据共享的隐私问题仍然是验证NLP方法泛化的关键挑战之一。令人鼓舞的是,人们对使用Transformer来生成人工心理健康临床记录来缓解这一问题越来越感兴趣。

基于文本的心理健康干预措施(例如,谈话空间和交叉文本线)的进展使临床会议的记录很容易接受NLP。除了开发检测自杀意念的模型外,NLP还可以应用于这些数据集,以确定人口水平的趋势,如COVID-19大流行期间焦虑程度的增加和人际关系质量的下降。由于语言数据无处不在,心理健康应用中的挑战之一是数据标准化。根据任务的不同,不同类型的数据可能会产生不同级别的“信号”。例如,为了预测首发精神病,临床测试中的语言数据比言论自由的记录有更高的表现。另一方面,从言论自由的诊断样本中收集的数据可以非常有效地开发一种基于语言的抑郁症筛查,它适用于不同年龄组。

6.4 社交媒体

到目前为止,社交媒体公司已经收集了大量可能包含临床相关信息的语言数据。这些信息不仅可以提取在人口层面,如认知扭曲的显著上升随着时间的推移,但也可以归因于个人层面,都使社交媒体一个强大的工具来支持精神健康风险评估和诊断。例如,Facebook帖子上的语言已经被证明含有抑郁症的标记物。在临床诊断前6个月,在这些数据中可以检测到沉思和悲伤。应用于Facebook和其他社交平台(如Twitter和Reddit)的模型已经成功地预测了精神病、厌食症、焦虑和压力水平的诊断。除了对用户帖子和评论的语言分析外,ML模型还可以处理媒体数据,如Instagram图像,或整合图像和文本来推断用户的心理状态。在线搜索项目与社交媒体活动一起,也形成了一个互补且同样引人注目的数据集。

最近,Transformer模型的发展,包括那些学习多语言语言表示的模型,使研究人员能够应用强大的NLP模型,从社交媒体数据中检测抑郁或自残。此外,经过特定心理健康对话训练并公开使用的专门语言表征已被证明与非特定表征相比能提高表现。最后,一种被称为Transformer的ML技术可以通过NLP评估文本响应,并预测传统的接近理论精度上限的主观幸福感指标。

虽然社交媒体通过数百万个样本解决了规模问题,但大多数社交媒体数据缺乏临床有效的标签。大多数报告的研究依赖于使用精神疾病自我披露的标签,这些标签不仅不准确,而且还带来了定义健康控制的额外问题。尽管存在这些挑战,但社交媒体数据的有效性已多次被证明支持心理健康诊断和风险评估。

6.5 感知技术和移动心理健康

智能手机、可穿戴设备和其他配备有环境传感器的设备(图7B)越来越能够记录已知的影响心理健康的生理测量数据。此外,一些不太明显的测量方法(如击键使用模式)已经被证明也与心理健康有关。在线游戏行为,例如,与非玩家角色(NPCs)的互动模式和其他游戏行为模式,可以用来衡量认知表现及其与精神疾病的关系。

图片
图片

图7.由ML技术驱动的心理健康技术说明。(A) ML应用程序。(B)针对数字测量工具的不同类型的数据收集策略。(C)是一个集成数字测量工具的技术基础设施。测量健康状况的独立平台将有自己的数据存储库,它们被描述为云。这些数据可以使用传输工具跨平台安全传输,如安全应用程序接口(API),使用虚线箭头描述。这些工具可以允许数据的单向和双向移动。ML可用于整合临床决策的所有措施。

来自移动传感器的测量可能构成有价值的心理健康数据来源(表5),并可在不同粒度级别上有用:从原始传感器数据(如加速度计)到派生的高级特征(如精神运动活动)。这激发了许多公司发明了基于从可穿戴设备上收集的数据来检测抑郁症和认知能力下降的技术。基于传感器的测量被发现与高压力水平和各种疾病相关,包括抑郁、焦虑、精神病和双相情感障碍。由于基于传感器的数据广泛且容易获得,它们为个体用户建立基线模型提供了机会,然后可用于识别用户的显著生理变化,并进一步为临床干预提供信息。从患者身上收集各种数据流的设备,如调查、认知测试、社交内侧互动、GPS坐标和行为模式(如键盘打字),在监测、管理和预测个人的心理健康方面具有巨大的潜力。总的来说,对这些数据流的纵向量化可能会产生有临床意义的标记物,这些标记物可用于改进诊断过程、定制治疗选择、改善条件监测以获得可操作的结果(如复发的早期迹象),并开发新的干预模型。

表5. 移动传感器测量和心理健康监测的潜在应用

图片
图片

6.6 商业和研究平台和服务

虽然研究已经证明了ML在个人心理健康旅程方面的应用是有希望的结果,但它们在临床实践中的广泛适用性仍然有限。表6列出了在心理健康应用程序中使用ML的平台和服务的示例。虽然大多数平台专注于基于单一模式的风险评估,但这些平台的初步商业可行性仍然有望在心理健康中使用ML的成功,因为它们能够收集大量数据,可用于进一步验证生物标记物。

表6. 针对心理健康应用程序的商业和研究平台和服务

图片
图片

有1万到2万款智能手机应用程序将正念或认知行为疗法(CBT)技术数字化,允许用户以与面对面治疗相比大大降低的价格进行心理治疗。然而,质量是高度可变的,并且用于验证它们的机制往往是可疑的。此外,由于这一领域相对较新,验证这种技术的行业和政府标准仍处于早期阶段。我们将简要概述两个相互关联的发展领域:数字测量和数字干预。

6.6.1 数字测量

我们正在进入一个数字精神病学的新时代。2016年,哈佛大学教授Jukka-Pekka Onnela创造了“数字表型”一词,它指的是使用移动设备和其他数字数据源来测量行为和生理,以理解与病理状态相关的大脑活动。这些技术利用了翻译神经科学的测量范式,这是在实验室环境中开发的,如直接量化运动(即运动、肌肉激活)和生理活动(即心率、皮肤电反应),比传统的临床量表或自我报告量表更多。这种方法的优点是,它更好地与快速作用生物过程的新兴知识相一致,并通过直接快速采样提供较高的测量精度,这与传统的长期零星采取的临床措施形成了对比。这些测量方法在多个领域具有相关性,包括治疗开发、治疗选择和持续监测。

针对心理健康状况的药物有明显的失败史。大多数精神药物都是反复无常的,而不是基于了解其潜在的生物学机制。随着新药物从基础和转化神经科学研究中出现,药物开发人员和临床医生都在努力研究如何衡量新的治疗方法的效果,以及如何正确地针对旧的治疗方法。例如,传统的抗抑郁药物被设计为缓慢滴定血清素水平,从而在2-4周的时间内产生缓慢的全球效果。相应地,基于DSM的抑郁测量,询问2周内抑郁状态的存在。新型的抗抑郁药,如氯胺酮和裸盖菇素,会在几分钟内影响特定的抑郁症状。此外,机制效应,因此测量的需要,是更具体和颗粒。事实上,大多数类别的抗抑郁药,包括5-羟色胺再摄取抑制剂(SSRIs)和裸胞菇素,氯胺酮,作用于5-羟色胺受体,最终影响外周运动和生理活动。血清素的调节可能对精神运动发育迟缓等抑郁症状有直接影响,但对内疚感的直接影响微乎其微。因此,用于直接测量运动输出的方法有更高的可能性捕获病理和治疗效果。

例如,研究工作已经致力于使用计算机视觉和声音来直接量化运动活动。最近的一些研究表明,反映大运动活动的数字表型参数,包括语音特征(说话率、音调)和面部/头部运动,与自杀风险,MDD 的SSRI反应,精神分裂症的阴性症状,和帕金森震颤相关。这种方法目前正在商业化,用于药物开发的所有阶段,从概念证明到直接测量,以便对正在进行的治疗需求作出决定。这些措施解决了目前临床测量中的许多问题,因为它们可以以自动化的方式远程捕获。这些度量也可以以更高的频率被捕获,并提供一个敏感的数值。

与此同时,这些新的测量方法也面临着重大的挑战。首先,采用实验室的方法往往缺乏正确解释数据所需的严格的实验控制。例如,生理反应(如肾上腺素和皮质醇,或HRV)的快速变化可能表明压力,但也可能表明运动或其他形式的运动。其次,虽然这些测量范式的科学基础可能是健全的,但商业方法很少被验证到临床效用所需的程度,或者它们在用于监管批准的方法上很少表面透明。

6.6.2 数字干预

心理健康技术的另一个快速出现的领域是临床护理的数字方法。我们将简要概述一些主要的方法。重要的是,临床护理的数字方法通常与数字测量方法相一致,因为这些方法是“盲目的”,没有某种远程数据。一些公司,如Mindstrong Health,IesoTrigger Health,和Headspace Health已经试图整合数字表型,以确定患者何时有急性临床需要。然而,目前还不清楚这些方法有多准确,因为它们通常未发表。这导致了模型的发展,这些模型可以识别患者和临床医生语言中的模式,这些模式是改善结果的标志;这些方法可以进一步用于衡量各种治疗方式和治疗设计的成功程度,以及提高护理质量。

数字疗法建议使用移动设备来提供CBT、正念或其他经过验证的心理治疗自动时尚。这些基于应用程序的方法经过与传统药物相同的临床验证过程,并且通常与大型药物开发商合作开发。正在开发中或已获得美国食品和药物管理局(FDA)批准的例子包括对SUD、ADHD、精神分裂症、ASD、MDD、创伤后应激障碍和广泛性焦虑障碍(GAD)的治疗。

数字疗法试图扩大治疗的规模,而远程医疗则旨在扩大治疗提供者网络的规模。心理健康治疗是一个有许多有效的治疗方法,但很少能获得治疗提供者的领域。在COVID-19出现期间,获得护理的问题变得最为严重,当时出现了大量广泛的心理健康需求,同时获得护理的机会大大减少。为了满足这一需求,出现了大量的方案,其中许多方案得到了2021年的COVID-19紧急远程保健法案,使远程患者护理成为可能。这些服务可由消费者直接访问,或者更多地由第三方支付人提供,提供基于不同移动平台的专业人员的访问,包括文本、语音和视频通信。服务从认证专业人员提供的心理健康指导到精神病医生和心理学家提供的心理健康评估。虽然还处于初级阶段,但早期证据表明,远程保健服务可以与传统的面对面治疗持平。

6.6.3 局限

尽管数字测量已迅速应用于心理健康应用中,但目前大多数用于心理健康的商业人工智能应用并没有集中在神经成像数据上。部分原因有几个原因。首先,数据采集、质量、隐私和安全问题没有得到充分或令人满意的解决(见讨论和结论),在商业和实验室设置之间造成了差距。其次,实时神经成像技术(如脑电图)的可扩展性还没有完全准备好。第三,缺乏一个自动和高效的(例如,基于云的)ML驱动的神经成像数据分析管道,也为大脑状态监测创造了一个障碍。未来,便携式脑电图记录和ML供电平台的集成将扩大移动心理健康和远程治疗的视野。

7. 诊断分析中的多模态数据融合

精确精神病学的一个中心目标是整合所有的临床、生理、神经成像和行为数据来获得能够进行个体化的诊断和治疗。重要的是,与健康相关的数据每天都会产生,特别是来自个人设备。在多模态数据分析任务中,最重要的努力是探索模态、互补性、共享与模态特定信息和其他相互属性之间的关系。多模态数据融合技术提供了一个框架来推断不同数据模式如何相互作用的信息,并可以集成以改进疾病预测。在本节中,我们将回顾诊断分析中的几种数据融合方法(用于多模态融合的流行ML方法)。我们将重点关注多模态神经成像数据(多模态神经成像研究),然后将讨论扩展到其他模式,包括声音和视觉表达数据(非成像数据的多模态融合)。

7.1 流行的多模态融合的ML方法

在过去的几十年里,许多的研究努力已经致力于开发强大的ML方法的多模态数据融合。下面总结了一些常用的方法(图8)。

图片
图片

图8. 精神病学研究中多模态数据融合的典型方法总结

7.1.1 多元相关分析

CCA是一种基于二阶统计量的数据融合的标准统计方法。它的目的是找到一对线性变换来驱动潜在变量(也称为[又名]规范变量),使两种不同数据模式之间的相关性最大化。对于更一般的设置,多集/多路CCA(mCCA)已被开发为标准CCA向多模态融合的扩展,通过最大限度地提高两组以上模式的潜在变量之间的整体相关性。与CCA类似,PLS及其扩展,即多路PLS(N-PLS),通过最大化来自不同模态的潜在变量之间的协方差,提供了整合多模态数据的替代方法。

7.1.2 矩阵和张量因子分解

基于矩阵和张量分解技术,开发了联合盲源分离(BSS)方法,并成功地应用于生物医学数据的多模态融合。作为一个典型的例子,联合ICA(jICA)旨在最大限度地提高来自假定共享相同模式的多个模式的共同估计的组件之间的独立性混合矩阵。jICA方法包括将模态特征相互连接,然后对复合特征矩阵执行ICA。独立向量分析(IVA)是ICA对多个数据集的另一个扩展。IVA通过定义源组件向量来连接从多个模式估计的特定源,来利用跨数据集的依赖性。耦合矩阵和张量分解(CMTF)也可以利用张量分解以矩阵和高阶张量的形式同时分解多个数据集,显示了在捕获多模态融合潜在的多线性结构方面的强度。除了提取共享的公共组件外,一些多模态融合任务还对推导特定于模态的单个组件感兴趣。为了实现这一目标,已经提出了共同和个体特征分析(CIFA)和联合和个体变异解释(JIVE)模型。通过联合分解多个特征矩阵,CIFA和JIVE能够同时估计公共特征子空间和单个特征子空间。利用高阶张量分解,这提供了一种执行多种数据模式的多维融合的有效方法。

7.1.3 多核学习

多核学习(MKL)在多模态数据融合中获得了许多成功的应用,因为它充分利用了多个核,能够利用异构数据同时从各种模态中学习。不同的内核自然对应于不同的模式,如神经成像、临床、行为、语音特征等,这可能提供互补的信息来驱动改善模态学习性能。MKL问题可以被设置为核矩阵的线性组合或具有特定正则化形式的非线性函数。MKL可以在不同的ML模型下设计,包括SVM、GP和聚类。其中,MKL-SVM在心理健康研究中最常用于整合异构数据模式。

7.1.4 基于深度学习的融合

尖端的深度学习技术在深度多模态融合中越来越流行。通过深度学习的数据融合允许集成基于学习到的高级特征表示的多种模式,这些模式在理论上更具可比性,为预测目标提供更多信息。通过利用跨模态流形作为特征图,最近设计了一个深度流形正则化学习模型,以整合来自神经元细胞的转录组学和电生理学数据,并在表型预测方面取得了良好的性能。GNN通过定义图结构特征之间的随意链接,显示了信息融合的多模态原因的能力,从而增强了导出的多模态特征表示的可解释性。通过将GNN扩展到多模态结构,还设计了深度表示方法,用于整合由不同模态构建的大脑网络。

7.2 多模态神经影像学研究

神经成像数据类型在本质上是不同的,具有不同的空间和时间分辨率。另一种方法不是将整个数据集进行组合分析,而是将每个模式简化为选定的大脑活动或结构的低维(潜在)特征,然后通过个体之间的变化来探索这些特征集之间的关联。从多种神经成像模式中利用这种潜在的特征表征来进行诊断,与单独使用单一模式相比,通常可以提高性能。多模态融合允许整合来自不同空间和时间分辨率的神经成像数据模式。结合多模态神经成像提供了一种优雅的方式来利用互补信息,以更准确和稳健地表征大脑功能障碍,因此有助于精神病学的诊断、预后和治疗的最佳决策。

mCCA和jICA联合治疗成功应用于fMRI和DTI融合诊断精神分裂症和双相情感障碍。CMTF已应用于识别诊断精神分裂症的生物标志物通过整合功能磁共振成像,功能磁共振成像和脑电图。MKL-SVM已成功应用于整合多模态结构神经成像预测双相鉴别诊断和单相抑郁症和结合功能磁共振成像和功能磁共振成像改进分类创伤幸存者有无创伤后应激障碍。最近,它也显示了通过整合sMRI、fMRI和DTI来诊断早期青少年ADHD的疗效。在学习fMRI和sMRI的低维表示时,fMRI可以被分成几个独立的组件网络,每个网络作为一个单独的模式,并使用自动编码器进行结构扫描学习。此外,MKL方法已通过结合MRI和DTI的标记物而被用于诊断精神分裂症。设计了一种多模态GCN来整合功能和结构连接组学数据,以改进ASD表型特征的预测。通过结合多种典型的神经网络结构,多模态学习模型也被开发出来,有效地整合fMRI连接和sMRI特征以及基因组数据,用于发现精神分裂症相关的脑功能障碍。从神经成像和非神经成像数据中学习关节表征的方法仍处于早期发展阶段,ML方法有机会发展到这项任务中。例如,具有晚期融合的变压器网络可以用来学习联合表示从各种模式,如脑电图和眼动信号。

7.3 非成像数据的多模态融合

多模态方法包括结合来自不同来源的数据,共同得出答案。鉴于我们对哪种类型的数据知之甚少,神经成像,社交媒体、语音、视频和传感器数据携带了精神疾病的最多表型,自然,结合来自这些数据来源的信息是有意义的。此外,这使得建模这些被人类专家可能无法同时观察到的数据之间的相互依赖关系成为可能。例如,表4中列出的许多特征都已知与抑郁症有关;然而,同时观察它们对临床医生来说是非常具有挑战性的。MKL和MTL方法已被用于联合学习传感器和智能手机的使用数据,以预测主观幸福感。Transformer网络在联合建模视频、语音和语言数据方面的成功,促进了心理健康中的多模态建模。多模态建模技术也可用于描述情绪失调、孤独、孤独和情绪分析等症状. 在一项预后研究中,开发了一种基于SVM的多模态ML方法,以整合临床、神经认知、神经成像和遗传信息来预测临床高危状态患者的精神病。基于深度自动编码器的融合方法已被设计用于整合面部和头部运动和发声的动力学,并成功地应用于抑郁症严重程度的预测。

7. ML用于精神病学中的分子表型分析

分子表型是指定量通路报告基因(即由代谢和信号通路特异性调节的预先选择的基因)的技术,以推断这些通路的活性。将基因和基因组学定位到行为上可以识别精神障碍中的风险因素和生物标志物。大脑是暴露于压力源和外部行为干预的中心器官,因此在系统水平上容易受到多个相互作用的生物网络的影响。ML方法可能在捕获多个级别内和跨多个级别的交互变量的复杂性方面发挥积极作用(图9A)。例如,在分子水平上,ML可能帮助识别基于机制的表型模型,作为预防和治疗情绪和认知障碍的新目标。无偏下一代测序(NGS)的出现促使了生物信息学和ML工具的发展,以在健康和疾病状态的全基因组水平上分析和解码大型分子数据集(如转录组学、表观基因组学、代谢组学)(图9B)。迄今为止,ML方法越来越多的应用已经将这些具有临床特征的多层次分子数据集整合起来,将特定的神经生物学基质映射到症状簇的复杂性中,这可能进一步有助于疾病的分类、治疗结果的预测和个性化治疗的选择。

图片
图片

图9. 精神病学分子表型的ML。(A)精神疾病中不同程度的相互作用变量(基因、细胞、回路)。(B)将ML与新的分子生物学技术(用于大脑可塑性的深层分子表型)相结合,为预防和治疗情绪和认知障碍的临床内表型开发新的机制模型创造了机会。

动物模型在精准精神病学中,在理解疾病机制和预测治疗反应方面发挥着至关重要的作用。整合神经科学、ML和生物信息学方法的基因表达研究,有助于促进对MDD的分子基础的理解,并弥合动物和人类之间的知识差距。使用RNA测序分析和基因共表达网络分析(基于层次聚类来识别基因模块),差异基因表达谱已经显示在六个关键大脑区域的死后组织MDD患者的年龄和性别匹配的控制,以及这些分子途径显著的性别差异。最近的研究使用单核分辨率(snRNA-seq)和t分布随机邻居嵌入(t-SNE)分析显示,在MDD病例中,死后背外侧前额叶皮层(PFC)的细胞类型特异性转录组谱受到差异调控。重要的是,这些在人类身上的基因表达研究得到了啮齿动物发现的支持,表明大脑随着经验的变化而不断变化。一些研究基于RNAseq分析和生物信息学分析显示惊人的转录组差异的腹侧和背侧海马的反应压力多个精神疾病的主要危险因素与腹侧海马不仅敏感压力的影响也应对下一代抗抑郁药的目标。

NGS向单细胞分辨率分析的扩展为先进的生物信息学和ML方法提供了对大型数据集进行分析的机会,其中包括去噪和降维、细胞类型分类、基因调控网络推断和多模态数据集成。例如,单细胞基因组学的软件工具包Seurat(https:// satijalab.org/seurat/)结合了无监督非线性降维、用于细胞类型聚类的k-最近邻图分析,以及用于多模态数据集成的加权最近邻分析。深度学习方法,如深度自动编码器,为去噪和降维提供了分析工具。自动编码器还可以以一种有监督的方式用于跨数据集的传输学习,例如从一个更大的先前注释的数据集学习嵌入,并将这些知识转移到集群新的数据集。通过同时评估转录组谱而产生的多模态数据的组合在同一单细胞中具有调控景观或空间位置将允许对离散细胞状态进行更深入的分子表征。

7.1 整合多维因素,为新的机制治疗模型

越来越多的人认识到,情绪和认知障碍不太可能只由大脑引起。相反,越来越多的证据表明,它们是系统水平的疾病,影响着多种相互作用的生物通路,涉及到大脑和身体之间的动态串扰。利用分层聚类将MDD患者体内脑代谢的分子测量与临床症状整合起来,最近的研究表明,特定的神经生物学底物映射到离散的临床症状,包括快感缺乏症。此外,整合线粒体代谢、细胞衰老、代谢功能和儿童创伤等多维因素可能会比个体因素提供更详细的特征,以预测作为抗抑郁药物治疗的抑郁症严重程度的纵向变化。此外,使用多组学方法和随机森林分类器在预测PTSD状态方面已经达到了85%的敏感性和77%的特异性。这种包含多种分子和生理测量的系统级诊断面板优于由每种单独数据类型组成的单独面板,显示出某些线粒体代谢物是最重要的预测因子。

ML应用的另一个例子包括整合多维表型措施,以确定那些机制,使明显健康的个体倾向于从那些赋予弹性的个体中发展出适应不良的应对策略。最近的一项研究使用了一个高通量无偏不倚的自动表型平台,收集了超过2000个行为特征,并应用监督ML来最小化贝叶斯误分类确认概率。研究结果表明,如此丰富的行为改变可以区分暴露于社会失败应激(SDS)后的易感表型和弹性表型。此外,ML分类器可以整合先验结构(如焦虑和免疫系统功能的测量),并预测给定的动物是否发展出SDS诱导的社会退缩或保持弹性。此外,特征的集成可以提高分类敏感度(80%),优于单独单独度量的性能。

诊断和治疗的个性化精神病学策略的发展将受益于满足最近出现的分子生物学协议的需求,这可能为捕获中枢神经系统纳米囊泡(称为外泌体)和检查特定的神经生物学底物(如转录组谱)提供机会。基于ML的动态网络分析还将使我们能够将脑分子靶点和信号通路与其他层次的分析联系起来,并纳入脑-体关系,以重新定义对整个复杂疾病过程中的机制的思考。

8. 精神病学XAI

XAI旨在通过将ML技术与有效的解释技术相结合,提供强大的预测价值以及对人工智能的机制理解。XAI在医学、金融、经济、安全和国防等领域发现了紧急应用。在精神病学中,XAI可以帮助阐明神经回路和行为之间的联系,并提高我们对治疗策略的理解,以增强认知、情感和社会功能。XAI从两个重要的方式区分标准人工智能:(1)它促进了透明度、可解释性和通用性;(2)将经典的“黑盒”ML模型转换为“玻璃盒”模型,同时实现可比或改进的性能。从诊断或预后的角度来看,了解ML解决方案是否可以解释到提供对大脑执行特定功能或复杂行为的方式的机制见解是至关重要的。例如,一个ML生成的分类函数来预测疾病结果不仅需要报告一个概率结果,还需要为最终用户解决其他问题:为什么是这个结果而不是替代结果?这个结果有多可靠?如果某个东西丢失或被歪曲,它什么时候会失败?什么时候以及为什么这个预测是错误的?因此,具有高可解释性的模型通常伴随着参数/结构/连通性约束或一些先验领域知识。这些可解释的模型可以不断地调整,这样可能需要一个迭代过程来迫使ML方法适合具有特定解释的模型。

8.1 ML模型的可解释力和可解释性

如果一个模型的结果和操作可以被人类用户理解,那么它就是可解释的。在分类学方面,ML模型的内在可解释性归因于它们的简单结构,如短决策树或稀疏线性模型(图10A)。事后可解释力是指模型训练后的解释方法的应用(在线资源:https://christophm.github.io/interpretable-mlbook/)。解释可能会以不同的形式出现:(1)有限的特征汇总统计信息,(2)有意义的模型参数,或(3)模型结果的简单可视化(例如,特征汇总或决策边界)。可解释性和可解释力是两个相似的概念,有时可以互换使用。可解释力通常,但不总是,意味着可解释性。模型是高度可解释如果它共享至少有一个以下属性的解释:高可移植性(关于模型可以应用的范围),高表达能力(关于模型强度解释结果),低半透明(关于模型依赖特定条件),低算法复杂性,和信息约束。一般来说,模型的解释性和性能之间存在权衡。例如,一个受约束的线性或双线性模型可能符合其中的许多标准,但线性模型不能保证良好的性能。此外,一个可能是可解释的模型并不能保证可解释力。例如,输入变量的相互依赖可能会使解释模糊;概率生成模型的潜在变量可能面临“解释”的问题。在这里,我们简要地提到了几类可解释的ML模型。

8.1.1 基于混合规则的ML模型

这种类型的ML模型可以用于生成规则,例如决策规则集:IF(条件)THEN(结果1)ELSE(结果2)语句,其中条件子句将从数据中学习。这种类型的模型具有更强的表达能力,但可移植性较低。

8.1.2 受约束的ML模型

这种类型的ML模型施加了参数约束,以避免过拟合和增强可解释性。这样的例子包括CNN模型中的约束卷积滤波器或用于聚类的约束混合模型。因此,这些受限的模型具有较低的半透明度。

8.1.3 反馈ML模型

ML模型可以在人-内循环系统中提供用户反馈,其中用户反馈被视为优化问题中的一个约束条件。反馈可以以一种预先已知或未知的规则集的形式出现。反馈还可以帮助插值缺失的数据和约束解决方案。迭代反馈规则优化步骤可以生成更准确的规则集。这类型号具有良好的表达能力和较高的便携性。

8.2 计算精神病学的环路水平建模

计算精神病学基于ML,与XAI有一个相似的目标,并试图将多个层次和类型的计算与行为和神经成像数据结合起来,以努力提高对精神疾病的理解、预测和治疗。计算水平从短到长时间尺度(分钟/小时/天/周),重点关注大脑活动和行为的变化。计算的类型包括环路水平建模、数据驱动的分析和理论驱动的算法开发。在计算精神病学中已经提出了两种互补的方法:(1)数据驱动的方法,它将ML方法应用于高维多模态数据来解决分类和预测问题(ML如何帮助精神病学?),(2)理论驱动的方法(如强化学习),它们开发了算法或机制模型来测试假设。

在第二种方法中,一个重要的研究课题是在任务或静息状态条件下的精神疾病大脑的宏观或介观大脑动力学的电路水平计算建模。一个常见的策略是首先使用生物启发模型来模拟神经活动基于神经质量的网络和接下来,在每个大脑区域,模型神经人口活动Wilson-Cowan神经质量模型,每个组成的兴奋和抑制人口。此外,根据单个脑节点的解剖网络耦合在一起。该计算模型可以由经验假设或脑电图/功能磁共振成像数据来驱动。

一种由数据驱动的宏观层次建模方法是动态因果建模(DCM)。DCM已被广泛应用于描述基于任务或rs-fMRI的功能网络的有效连接,其中模型参数是从无监督学习中推断出来的。通过结合网络连接的先验知识或假设,DCM可以揭示重要的大脑机制,并提供实验预测。DCM的一个潜在应用是表征人类大脑的神经可塑性,特别是由神经成像研究提供的功能连接的变化。功能连接既可以在任务过程中逐渐改变,也可以由神经刺激引起。这些变化通常是,但并不总是,与特定的大脑区域的功能激活的变化有关。

9. 关闭了通过神经刺激来测试因果关系的循环

从治疗的角度来看,获得对精神疾病中导致认知功能失调和适应不良行为的大脑动力学的更好的理解是至关重要的。为了找到隐藏的原因,因果关系的概念需要在干扰大脑活动时特别注意。由于人类大脑和脑行为关系的复杂性,适应性闭环神经刺激为理解健康和患病的大脑提供了关键的一步。

神经成像提供了一种被动感知的方法来观察(相关的)大脑行为关系。然而,相关性不同于因果关系。相关依赖性描述了实验不能控制的测量值之间的关联,而因果依赖性将因变量与实验控制的变量联系起来。因果推理的关键概念是引入随机化来扰动映射。每个可靠变量与随机变量之间的关系是因果关系,而非随机变量与行为之间的关系仍然是相关的。一个闭环实验设计将有助于测试潜在的因果关系。在人体实验中,我们将闭环测试分为两类:一类是完全自动化的,另一类是在闭环中封闭的人类。

人类精神神经科学的一个大挑战是因果关系的差距。两个变量之间的统计因果关系或格兰杰因果关系并不等同于脑行为因果关系。为了确定一种有效的精神疾病治疗策略,因果调节神经回路是至关重要的导致适应不良行为。人类的神经成像本身只显示了相关性,而不显示因果关系。为了理解因果机制,必须在实验中通过扰乱大脑回路并测量其结果来关闭这个循环,就像在动物实验中通常做的那样。不幸的是,临床症状和行为的严格和因果基础仍然缺乏。由于临床症状是多样的,如何定义一个或几个临床症状的脑功能维度以及如何有效地操纵它们仍然是未知的。此外,闭环神经刺激在心理健康研究中与XAI有概念联系,可以看作是人类脑机接口(BMI)设计的一个扩展,用于因果测试脑行为映射。

神经调节疗法在治疗各种神经精神疾病和神经系统疾病方面已经变得越来越流行。时间上精确的神经刺激工具提供了一种合理的方法来干扰或刺激大脑。临床使用的神经调节方法包括有创深部脑刺激(DBS)、无创经颅磁刺激(TMS)、无创经颅直流/交流电刺激(tDCS/ tACS)、经颅聚焦超声刺激(tFUS)。回顾神经调节技术治疗精神障碍的进展可以在文献中找到。迄今为止,重复TMS(rTMS)已被FDA批准用于治疗抑郁症,最近已被用于神经功能和行为的研究。在这一研究方向上,ML可能有助于解决三个重要的问题(在哪里/何时/如何),以在精神病学中实现精确的神经调节。

对于where的问题,根据神经运动技术,传递目标特异性刺激需要主动和计划的刺激策略来识别行为激活的目标。在抑郁症的情况下,神经刺激可以有多个潜在的靶点或作用模式,但如何确定最佳靶点以实现有效的治疗结果仍未被探索。与开环刺激相比,对于问题何时以及如何,闭环刺激可以提供由检测到的特征、症状或用户需求触发的时间精确刺激。传统的神经刺激策略以开/关刺激的方式设计,其中刺激由预先选择的参数决定。然而,这些刺激参数可能不是最佳的。为了适应适应性受试者特定的刺激策略,适应性刺激使用神经反馈来调整刺激参数或控制策略,以达到各种最优标准。因此,ML在在线自适应刺激中起着指导作用。例如,反馈回路可以分析神经信号的振荡模式或其他可靠可检测的生物信号(如生物化学、肌电图和机械信号)来分类或检测传递闭环神经刺激的关键大脑状态。此外,强化学习可应用于学习状态-动作值函数,以确定最佳兴奋性大脑状态,其中状态对应于神经活动(例如,诱发电位的振幅,大脑连接的特征),动作对应于开/关刺激模式。

神经刺激不仅可以引起行为的改变,还可以诱导大脑连接的可塑性。同时或神经刺激后的神经成像提供了一个窗口来检查大脑网络连接模式的变化。大脑的连接和动态可以从网络通信和控制的角度来研究。健康和病理大脑的区别可以具有不同的效率路径信息分布的大脑节点,控制或调节目标节点在特定约束下,或影响其行为执行特定任务。因此,成熟的网络和图论可以用来研究控制器(神经刺激器)对大脑连接的变化。具体来说,控制理论模型也被用于量化大脑网络对外源性和内源性扰动的反应。沿着这条线可以研究几个重要的研究问题:(1)目标节点刺激能否在诱发和稳态条件下重新连接大脑连接?(2)神经刺激诱导的诱发或静息态脑连接的改变能否区分病理和健康的大脑?(3)给定一个控制器的能量约束,最优的神经刺激策略是什么?多个部位交替或同时的神经刺激是更有效地影响网络连接还是在治疗中带来额外的好处?(4)诱导的大脑模式或网络连接的改变是否可以预测治疗的结果?ML可以通过提供精确精神病学中的个体化治疗反应可能性来解决这些问题。

最后,我们建议结合XAI和神经刺激的多种努力(“神经成像/电路建模/神经刺激/观察行为/修正模型”;图10B)将提供一个有效的途径,以更好地理解大脑行为的原因和个性化的精确治疗的精神病学。例如,循环神经调节和DCM可能提供了一种方法来测试神经刺激对神经可塑性的影响,这是适应性或不适应行为变化的基础。

图片
图片

图10. ML模型的可解释性和闭环脑行为干预。(A)代表性ML模型具有广泛的可解释性。(B)神经成像/建模/神经刺激的闭环示意图。

10. 讨论和结论

10.1 挑战和机会

在过去的几十年里,人们对精确精神病学的ML方法的兴趣和快速发展。然而,对于ML在临床实践中应用的不现实的希望也提出谨慎,该领域仍然面临着概念和实际的挑战。

在概念层面上,首先,障碍一词被专门用来避免疾病一词,这意味着在精神病学中仍然缺乏精确的机制理解;这进一步使得建立精神障碍的临床推理模型非常困难。因此,开发以类似于其他医学学科(如治疗心脏病中高血压)的方式针对潜在生理危险因素的治疗方法仍然不可行。此外,每种精神障碍都有不同程度的重叠症状,这给精神障碍的唯一定义带来了困难。其次,许多疾病被呈现为一个谱系(例如,ASD、广泛性焦虑谱系和精神分裂症谱系),并在不同的患者中有所不同,在同一类型的精神障碍中产生了广泛的亚型和被试可变性。第三,由于各种遗传、生化和神经病理因素同一精神障碍在不同的年龄/性别/种族的人群中可能有不同的原因和症状。第四,在许多精神障碍中都可以发现重叠的症状,这使得诊断不那么精确或更容易出错。例如,睡眠和能量水平的变化,通常在抑郁症中发现,通常使用PHQ-9问卷进行测量,在许多其他疾病中非常常见。精确精神病学的一个目标是充分剖析其机制,并因果地揭示多对一的关系。这可以通过对与心理健康相关的神经和行为数据的严格测量和量化来实现。

在实际层面上,ML在心理健康方面的有效应用也存在许多挑战。

10.1.1 样本量

在许多ML应用程序中使用的数据集的样本量都很小,特别是根据基于ML的语音/图像/视频应用程序的标准。从心理健康患者中收集的神经成像数据仅限于一次性的例子,这除了具有内在的异质性和疾病共病外,还产生了很大的数据可变性。在基础模型及其心理健康应用方面的最新发展可能有助于克服这一挑战——例如,通过共享预先训练好的语言模型。然而,需要进一步谨慎,以确保对特定问题的数据进行适当的验证方法。可重复性是任何精神障碍的生物标志物发现的主要瓶颈。

10.1.2 数据质量

在数据采集方面缺乏标准化和不同程度的数据质量在严谨性和再现性方面提出了挑战。例如,使用社交媒体数据的研究往往依赖于基于用户自我识别的精神障碍标签,而不是严格的临床诊断。这可能会导致一篇包含“我很抑郁”的帖子被贴上了抑郁样本的标签,而不管潜在的临床症状如何。抑郁或焦虑等术语具有口语用法,可能不同于临床标准,导致样本标记不准确。此外,考虑到用户的年龄、性别、种族、教育程度、家族史和生活方式的多样性,收集适当匹配的对照样本仍然很困难。此外,在数据收集过程中也存在内在的数据集偏差。

10.1.3 数据隐私和安全

传感技术的进步使我们能够收集大量的个人数据,包括位置、人脸图像、语音对话和社会互动。然而,如何在不存在隐私信息泄露风险的情况下存储和处理这些数据仍然是一个重要的挑战。虽然研究研究有规章制度(如内部审查委员会),以确保道德使用,但社交媒体数据是由公司大规模收集的。由于缺乏充分的监管,这类数据没有被视为可用于告知用户健康状况的个人可识别信息(PII),这为保护可识别的用户数据造成了一个主要障碍。为了帮助缓解这一问题,美国的法规,如健康保险便携性和责任法案(HIPAA),可以被用来管理被所有社交媒体公司和商业实体收购的PII。

10.1.4 社会影响和环境因素

性别和种族是影响心理健康的关键因素。根据世界卫生组织的说法,精神障碍有长期的性别偏见的历史。就性别风险因素而言,女性更容易遭受痛苦抑郁而焦虑症中自闭症更普遍。在性别治疗偏见方面,与男性相比,女性更有可能被诊断为抑郁症,而女性更有可能服用酒精性精神药物。ML可能在揭示性别或种族风险因素和减少与这些社会因素相关的诊断或治疗偏差方面发挥作用。??

10.1.5 泛化性

标准的ML泛化问题在心理健康应用程序中变得更加明显,特别是由于数据质量差和样本量小。大多数ML研究使用交叉验证来报告性能,但缺乏独立的验证数据集来评估通用性。此外,很少有研究测试跨数据源和实验条件的泛化。例如,测试从临床访谈的语音数据中训练出来的ML模型对非临床语音数据的表现如何是很重要的。

10.1.6 算法偏差

数字心理健康继承了精神病学的长期偏见历史,这可以在病人旅程的所有阶段找到。除了生物学基础外,数据领域(如语言)也代表社会基础,因此考虑社会经济因素如何影响测量是重要的。使用在所有人口统计数据中都具有代表性的培训和验证集,不仅可以帮助解决这些问题,而且还可以发现不同组中的新症状表达。这对于继承了来自其他ML模型的偏差的ML方法更为重要。

10.1.7 可解释性

了解哪些潜在因素对结果贡献最大的能力是促进心理健康专业人员对精神障碍的临床理解以及为心理健康技术的用户建立信任的关键。这也是提高心理健康精度的一个重要方面。解释方法的选择,无论是特定的模型(如分析Transformer的注意力权重)还是模型不可知(如局部可解释的模型不可知解释[LIME]),都是非常特定的问题的性质。虽然可以使用各种解释方法来识别模型的功能,但需要注意的是,只有解决了通用性和数据质量的问题,解释结果才会被信任。换句话说,模型解释方法可能产生数据不足或不稳定的结果。此外,总是存在一种“可解释性-性能”的权衡。例如,深度学习可能优于传统方法,但代价是降低了可解释性。尽管XAI和可解释ML技术的发展取得了快速进展,但ML可解释性的挑战仍然存在于精神病学应用中,特别是在处理混合模态数据、高维数据和在不同时间尺度上测量的数据时。

10.1.8 因果推论

心理健康中的大多数ML应用都集中于集成来自多个数据源的信息,并更快地实现诊断决策。然而,诊断一种精神障碍,即使有一个高度可解释的模型,既不能说明根本的原因,也不能对治疗原因的影响有限。基于ML的因果推理方法可能有助于精确的治疗设计。最近的研究表明具有足够的时间和空间分辨率的超高场神经成像可能为开发精神障碍的推理模型提供了一种手段。

10.1.9 临床整合

从用户体验的角度来考虑临床需求是很重要的,从使用应用程序的心理健康专业人员到精神疾病患者。这项工作的一部分,如在各种人口统计数据中进行用户研究,位于ML领域之外;然而,这种交叉功能研究可以为ML模型开发的最佳实践提供信息。这种带有最终目标的思维方式对于成功地将精确的精神病学研究转化为广泛的临床实践是很重要的。此外,考虑到临床和ML社区之间可能存在的利益差异,跨学科对话和合作将有助于在临床实践中部署ML解决方案。

10.1.10 伦理考虑

ML在心理健康中的应用也提出了重要的伦理考虑。例如,用于风险评估的ML模型可以导致早期筛查,这可能有助于早期治疗。然而,当筛查技术在临床环境之外可用时,它可能会造成患者误解的风险,这可能会对寻求治疗的行为产生负面影响,或触发患者的自残想法。其他与增加自残风险相关的伦理问题也来自于ML,它使用了生成预训练Tranformer 3(GPT-3)等基础模型,在临床环境中部署前应充分考虑。

10.2 新的ML技术的应用

除了解决上述挑战所带来的机会外,精确精神病学在未来的ML应用中也伴随着大量的机会。

10.2.1 数据为中心的方法

在数据驱动的ML视图(“ML系统 = 模型/算法+data”)中,数据非常强大。然而,收集医疗数据的费用很昂贵,而且噪音也很大。目前,ML的范式已经从以模型为中心转变为以数据为中心(https://datacentricai.org/),它提倡使用好的“小”数据,而不是简单地从大的,但可能是嘈杂的数据中收集。高质量的标准包括(1)一致性,(2)重要案例的覆盖范围,以及(3)包含来自用户或生产数据的及时反馈。以模型为中心的ML方法侧重于修改模型/算法(同时修复数据)以提高性能,以数据为中心的ML方法涉及构建具有高质量数据的ML系统,目标是系统地处理数据(同时修复模型)以提高ML性能。对可用数据的修改可能包括数据再生、数据增强和标签改进策略,以提高数据的一致性。例如,自信学习已经被提出来估计标签的不确定性和识别标签误差,基于修剪噪声数据的原则,计算概率阈值来估计噪声,并排序例子进行信心训练。这两种方法的迭代过程可以引导系统的性能。

10.2.2 数据增强方法

为了处理患者数据收集中的小样本量问题,一种ML方法是创建合成数据(作为一个数据或增加训练实例的数量。深度学习方法,如GAN及其变体,已经成为生成合成大脑扫描图像、语音、视频、生理数据和电子病历的强大工具。然而,与传统的ML/计算机视觉研究不同的是,合成训练样本在精神病学应用中的价值仍然不清楚。ML增强的样本是否能够产生符合精神异质性的有临床意义和多样化的样本,还需要未来的深入研究。

10.2.3 自动学习方法

与循环中的人工解决方案相比,自动化ML(autoML)和自动化深度学习(autoDL)代表了一种新的范式,旨在使数据分析管道自动化,同时尽量减少建模和训练过程中对人工干预的需要。这一点已经变得越来越重要,因为社交媒体和多媒体数据流的数量非常庞大,即使是人类参与的少量努力也会使这项任务令人望而却步。

10.2.4 数据集成方法

多模态数据的集成对精神疾病的诊断和监测至关重要。因此,迫切需要开发弱监督、可解释、多模态深度学习管道,以融合组织病理学、基因组学、神经成像和行为数据,以及开发用于语音、视频和电子病历的多模态融合算法,以帮助精神病医生和患者。由于多模态的性质,并不是所有的数据都能在欧几里得空间中被量化。图形和几何深度学习可能在这一研究方向中发挥作用。最后,专家增强ML(EAML)方法自动提取特定问题的人类专家知识并将其与ML集成,以构建健壮、可靠和数据高效的预测模型,也将在精神病学领域具有巨大的应用潜力。

10.3 结论

迄今为止,仍然缺乏生物标志物和个体化治疗指南。在这篇综述中,我们展示了ML技术和数据分析可以用于患者旅程的不同阶段:检测/诊断、预后、治疗选择/优化、预后监测/跟踪和复发预防。我们预测,神经成像、ML、遗传学、行为神经科学和移动健康的多模态整合将为新方法的发展和技术发明打开大门。首先,使脑部扫描更容易获得将是神经成像技术临床应用的关键。利用实时功能磁共振成像,ML可以指导基于神经反馈的干预,并提供闭环治疗或康复。作为精神病学的“实时镜子”,精神控制干预可以改善行为结果。其次,数据驱动的ML方法可以识别症状和认知缺陷的亚型,并开发基于模型的表型。第三,ML方法与大型EHR数据库的结合可以适应个性化的精神病学。第四,在为精神病学开发以ML为动力的技术时,必须考虑来自各种利益相关者的关注和反馈,包括知识渊博的专家(临床和ML专家、技术或工程师专家)、决策者(医院管理人员、机构领导人、州和联邦政府)和最终用户(医生、护士患者、朋友和家庭)。最后,药物、可穿戴设备、移动健康应用程序、社会支持和在线教育的整合将对在数字精神病学的新时代改善精神健康和协助治疗结果至关重要。未来的精确精神病学将利用ML和所有技术来提供基于患者的需求和特定病理的个性化定制包。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 全局
  • 2. 摘要
  • 3. 引言
  • 4. 神经影像学背景
  • 4.1 神经影像学进展
  • 4.2 神经影像学分析
  • 4.3 特征工程
  • 5. ML如何帮助精神病学?
  • 5.1 精神病学与其他医学学科的比较
  • 5.2 临床需求驱动ML应用于心理健康
  • 5.3 有监督的和无监督的学习
  • 5.3.1 有监督的学习
  • 5.3.2 集成学习
  • 5.3.3 无监督的学习
  • 5.3.4 半监督的学习
  • 5.3.5 规范建模
  • 5.4 深度学习
  • 5.4.1 深度自编码器
  • 5.4.2 卷积神经网络(CNNs)
  • 5.4.3 图神经网络(GNNs)
  • 5.4.4 递归神经网络(RNNs)
  • 5.4.5 生成对抗网络(GANs)
  • 5.5 精准精神病学的关键ML概念
  • 5.6 研究案例
  • 5.6.1 研究案例1:稀疏潜在空间学习用于基于EEG的抑郁症治疗预测
  • 5.6.2 研究案例2:基于无监督学习的精神疾病中神经生理学亚型的识别
  • 5.6.3 研究案例3:基于恐惧消退学习任务的功能磁共振成像对焦虑和非焦虑大脑的分类
  • 5.6.4 研究案例4:从多部位颅内脑活动中解码情绪状态
  • 6. 精神病学的ML驱动技术
  • 6.1 移动和传感技术
  • 6.2 语音和视频分析
  • 6.2.1 音频和语音功能
  • 6.2.2 视觉特征
  • 6.3 自然语言处理(NLP)
  • 6.4 社交媒体
  • 6.5 感知技术和移动心理健康
  • 6.6 商业和研究平台和服务
  • 6.6.1 数字测量
  • 6.6.2 数字干预
  • 6.6.3 局限
  • 7. 诊断分析中的多模态数据融合
  • 7.1 流行的多模态融合的ML方法
  • 7.1.1 多元相关分析
  • 7.1.2 矩阵和张量因子分解
  • 7.1.3 多核学习
  • 7.1.4 基于深度学习的融合
  • 7.2 多模态神经影像学研究
  • 7.3 非成像数据的多模态融合
  • 7. ML用于精神病学中的分子表型分析
  • 7.1 整合多维因素,为新的机制治疗模型
  • 8. 精神病学XAI
  • 8.1 ML模型的可解释力和可解释性
  • 8.1.1 基于混合规则的ML模型
  • 8.1.2 受约束的ML模型
  • 8.1.3 反馈ML模型
  • 8.2 计算精神病学的环路水平建模
  • 9. 关闭了通过神经刺激来测试因果关系的循环
  • 10. 讨论和结论
  • 10.1 挑战和机会
  • 10.1.1 样本量
  • 10.1.2 数据质量
  • 10.1.3 数据隐私和安全
  • 10.1.4 社会影响和环境因素
  • 10.1.5 泛化性
  • 10.1.6 算法偏差
  • 10.1.7 可解释性
  • 10.1.8 因果推论
  • 10.1.9 临床整合
  • 10.1.10 伦理考虑
  • 10.2 新的ML技术的应用
  • 10.2.1 数据为中心的方法
  • 10.2.2 数据增强方法
  • 10.2.3 自动学习方法
  • 10.2.4 数据集成方法
  • 10.3 结论
相关产品与服务
数据集成
数据集成(DataInLong)源于腾讯开源并孵化成功的 ASF 顶级项目 Apache InLong(应龙),依托 InLong 百万亿级别的数据接入和处理能力支持数据采集、汇聚、存储、分拣数据处理全流程,在跨云跨网环境下提供可靠、安全、敏捷的全场景异构数据源集成能力。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
http://www.vxiaotou.com