研究表明:机器学习模型并不适合对新冠肺炎患者的临床诊断

   绕波特        

研究人员发现,在2020年科学论文中描述的300多种机器学习模型中,由于偏见、方法缺陷、缺乏可重复性,它们都不适合从标准医学成像中检测或诊断。


由剑桥大学领导的研究团队对科学手稿进行了系统的综述,该手稿于2020年1月1日至10月3日发布,描述了机器学习模型,该模型声称能够通过胸部X光片诊断或预测新冠肺炎。


研究表明:机器学习模型并不适合对新冠肺炎患者的临床诊断


他们的搜索确定了2,212项研究,其中初筛后包括了415项,筛查后,有62项研究被纳入系统评价。鉴于迫切需要验证的新冠肺炎模型,因此62个模型中没有一个具有潜在的临床用途,这是一个主要弱点。该成果公布在Nature杂志上机器智能。


机器学习是用于疾病检测和预后的有前途且潜在强大的技术。机器学习方法,包括将影像和其他数据流与大型电子健康数据库相结合的方法,可以通过改进对治疗的个体反应的诊断和预测来实现个性化的药物治疗方法。


研究表明:机器学习模型并不适合对新冠肺炎患者的临床诊断


剑桥大学应用数学和理论物理系的第一作者迈克尔·罗伯茨博士说,任何机器学习算法都只能与训练过的数据相提并论。特别是对于像新冠肺炎这样的新型疾病,至关重要的是,训练数据应尽可能地多样化,因为正如我们在整个大流行中所看到的那样,有许多不同的因素会影响该疾病的外观及其发生方式。


剑桥大学医学系的联合资深作者詹姆斯·鲁德(James Rudd)博士说,国际机器学习界已为使用机器学习解决新冠肺炎大流行做出了巨大努力。这些早期研究显示出希望,但它们在方法和报告方面普遍存在缺陷,我们审查的所有文献均未达到支持在临床实践中使用所必需的稳健性和可重复性的阈值。


许多研究受到以下问题的困扰:质量数据质量差,机器学习方法的应用性差,可重复性差以及研究设计存在偏见。例如,一些训练数据集使用来自儿童的图像作为其非新冠肺炎数据,使用来自成人的图像作为其新冠肺炎数据。由于儿童感染新冠肺炎的可能性远低于成年人,因此,所有机器学习模型都可以有效地分辨出儿童与成年人之间的区别,因为包括儿童的图像使该模型有很大的偏见。


许多机器学习模型都是在样本数据集上训练的,样本数据集太小而无法有效发挥作用。在大流行初期,人们对信息的渴望如此之大,但是,如果您基于单个医院的数据来建立模型,那么它可能无法用于下一个城镇的一家医院的数据:数据需要多样化并且理想地是国际化的,否则您将设置机器学习如果经过更广泛的测试,则可以建模失败。


在许多情况下,研究没有指定数据的来源,或者没有对模型进行相同的数据训练和测试,或者基于可公开获得的“ Frankenstein数据集”,这些数据随着时间的流逝而发生了演变和合并,因此不可能重现初始结果。


许多研究中的另一个普遍存在的缺陷是放射科医生和临床医生缺乏参与。无论您使用机器学习来预测天气或疾病如何发展,确保不同的专家一起工作并讲相同的语言至关重要,这样就可以着眼于正确的问题。


尽管他们在新冠肺炎模型中发现了缺陷,但研究人员表示,通过进行一些关键的修改,机器学习可以成为对抗这种流行病的有力工具。例如,他们告诫不要过分使用公共数据集,否则可能会导致明显的偏差风险。此外,数据集应该是多样的并且大小合适,以使该模型对不同的人口统计群体有用,并且应该对独立的外部数据集进行管理。


最新评论(0)条评论
不吐不快,我来说两句

还没有人评论哦,抢沙发吧~

相关新闻推荐