您的位置:首页 >科技 >

模型改善了ICU患者死亡风险的预测

2019-06-11 17:17:25   编辑:   来源:
导读 在重症监护室,患者进入各种健康状况,分类在很大程度上依赖于临床判断。ICU工作人员进行了许多生理测试,例如血液检查和检查生命体征,以

在重症监护室,患者进入各种健康状况,分类在很大程度上依赖于临床判断。ICU工作人员进行了许多生理测试,例如血液检查和检查生命体征,以确定如果不进行积极治疗,患者是否立即面临死亡风险。

输入:机器学习。近年来已经开发了许多模型来帮助预测ICU中患者的死亡率,这取决于他们在住院期间的各种健康因素。然而,这些模型具有性能缺陷。一种常见类型的“全球”模型是针对单个大型患者群体进行训练的。这些可能在平均水平上有效,但在一些患者亚群中效果不佳。另一方面,另一种类型的模型分析不同的子群体 - 例如,按类似条件,患者年龄或医院部门分组的那些 - 但通常具有用于训练和测试的有限数据。

在最近在知识发现和数据挖掘会议上发表的一篇论文中,麻省理工学院的研究人员描述了一种机器学习模型,该模型在两个方面都是最好的:它专门针对患者亚群进行训练,但也在所有亚群中共享数据以获得更好的效果预测。通过这样做,与严格的全球模型和其他模型相比,该模型可以更好地预测患者在ICU前两天的死亡风险。

该模型首先处理了先前入院的ICU患者的电子健康记录中的生理数据,其中一些患者在住院期间死亡。在这样做的过程中,它学会了很高的死亡率预测因素,例如低心率,高血压和各种实验室检测结果 - 高血糖水平和白细胞计数等 - 在最初几天内将患者分成亚群根据他们的健康状况。给定一名新患者,该模型可以从头24小时查看该患者的生理数据,并使用通过分析这些患者亚群获得的知识,更好地估计新患者在接下来的48小时内死亡的可能性。

此外,研究人员发现,通过特定亚群评估(测试和验证)模型还突出了全球模型在预测患者亚群死亡率方面的性能差异。这是开发可以更准确地与特定患者一起工作的模型的重要信息。

第一作者,计算机科学与人工智能实验室(CSAIL)的研究生Harini Suresh说:“ICU的带宽非常高,患者很多。” “重要的是要提前弄清楚患者实际上处于危险之中并且更需要立即引起注意。”

该论文的共同作者是CSAIL研究生Jen Gong和John Guttag,Dugald C. Jackson电气工程教授。

多任务处理和患者亚群

该项工作的一项重要创新是,在培训期间,该模型将患者分为不同的亚群,这些亚群捕获患者整体健康状况和死亡风险的各个方面。它通过计算按小时分解的生理数据的组合来实现。生理数据包括例如葡萄糖,钾和氮的水平,以及心率,血液pH,氧饱和度和呼吸速率。血压和钾水平升高 - 心力衰竭的迹象 - 可能表明健康问题超过其他亚人群。

接下来,该模型采用多任务学习方法来构建预测模型。当患者被分成亚群时,为每个亚群分配不同的调整模型。然后,每个变体模型可以更准确地对其个性化患者组进行预测。这种方法还允许模型在进行预测时在所有子群体之间共享数据。当给予新患者时,它将患者的生理数据与所有亚群匹配,找到最佳拟合,然后从那里更好地估计死亡风险。

“我们正在使用所有患者数据并在相关的人群中共享信息,”Suresh说。“通过这种方式,我们能够......不会遇到数据稀缺问题,同时考虑到不同患者亚群之间的差异。”

“入住ICU的患者常常因为他们在那里以及他们的健康状况而有所不同。因此,他们将受到非常不同的待遇,”Gong补充道。临床决策辅助“应该考虑到这些患者群体的异质性......并确保有足够的数据进行准确的预测。”

Gong说,这种方法的一个关键见解来自于使用多任务处理方法来评估模型在特定子群体上的表现。通常在整个患者群体中评估全局模型的整体表现。但研究人员的实验表明,这些模型实际上在亚人群中表现不佳。本文测试的全球模型总体上相当准确地预测了死亡率,但在对个体亚群进行测试时,准确度下降了几个百分点。

如果不通过亚人群进行评估,这种表现差异很难衡量,龚说:“我们想要评估我们模型的效果,不仅仅是对整个患者队列进行评估,而且还要评估我们为每个具有不同医学特征的队列进行分解时。这可以帮助研究人员进行更好的预测模型培训和评估。“

获得结果

研究人员使用来自MIMIC重症监护数据库的数据测试了他们的模型,该数据库包含有关异质患者群体的大量数据。在该数据集中约32,000名患者中,超过2,200名患者死于该医院。他们使用80%的数据集进行训练,20%用于测试模型。

在使用前24小时的数据时,该模型将患者聚集到具有重要临床差异的亚群中。例如,两个亚群包含在最初几个小时内血压升高的患者- 但一个随着时间的推移而降低,而另一个则在一整天内保持升高。该亚群的死亡率最高。

使用这些亚群,该模型预测了患者在接下来的48小时内的死亡率,具有高度特异性和敏感性以及各种其他指标。多任务处理模型的表现明显优于全球模型几个百分点。

接下来,研究人员的目标是使用来自电子健康记录的更多数据,例如患者接受的治疗。他们还希望将来培训模型,从数字化临床笔记和其他信息中提取关键词。

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢