IEEE J Biomed Health Inform:检测早期轻度认知障碍,遗传进化随机森林法大有可为
2021-04-04 MedSci原创 MedSci原创
该研究设计了脑区与基因融合的方法,并通过相关分析构建融合特征。这种融合特征被称为脑区-基因对(BR-gene)。提出了一种遗传进化随机森林(GERF)方法,以克服少而高维数据和研究框架不完整的限制。
早期轻度认知障碍(EMCI)是介于正常衰老和阿尔茨海默病(AD)之间的一种临床状态。发展成阿尔茨海默病(AD)是非常危险的,它是痴呆症的高危状态。一旦发展成AD,这一过程将是不可逆转的,给家庭和医疗机构增加了沉重的负担。因此,早期发现EMCI对预防或延缓痴呆的发生和发展具有重要意义。随着复杂脑部疾病检测技术的快速发展,生物医学数据量急剧增加,如功能磁共振成像(fMRI)数据和遗传数据。在脑部疾病的全面系统研究中,基因与神经影像的融合研究越来越受到重视。这对于揭示复杂脑部疾病的多因素发病机制,进一步帮助临床诊断和精确医学具有重要意义。疾病相关多模式数据的融合分析对于阐明复杂脑部疾病的发病机制正变得越来越重要。然而,由于多模态数据量小、维数高,现有的机器学习方法不能完全达到融合特征选择的高准确性和高可靠性。Xia-an Bi提出了一种基于遗传数据和静息功能磁共振成像(rs-fMRI)数据的遗传进化随机森林(GERF)算法,用于发现早期轻度认知障碍(EMCI)的危险基因和疾病相关脑区。研究成果发表在IEEE J Biomed Health Inform杂志。
利用经典的相关分析方法探索脑区与基因之间的关联,并构造融合特征。引入遗传进化思想,提高分类性能,有效提取最优特征。利用公共的阿尔茨海默病神经成像计划(ADNI)数据库对所提出的GERF算法进行了测试,结果表明,该算法在小样本学习中取得了令人满意的分类精度。此外,还将GERF算法与其他方法进行了比较,证明了该算法的优越性。
基于分类器的最优数量。基于不同数量的基分类器,遗传进化的最低次数是最优的
最优BR-gene对的前20对。顶部代表基因,底部代表大脑区域。
多模态数据最优融合特征的定量比较
性能比较。比较包括GERF的分类性能分析和GERF与双样本t检验的比较。
大脑异常区域的频率和位置。(a)大脑某部分区域的频率。(b)大脑相应区域的位置。
36个基因的频率。权重较大的基因为CNTN5、ger7、CTNNA3、TTC3和FHIT。
在此基础上,提出了病原检测的总体框架,该框架可准确、高效地应用于EMCI的多模态数据分析,并可推广到其他疾病。本研究为EMCI的早期诊断和临床病理分析提供了新的思路,有利于临床医学控制疾病的进一步恶化,有利于通过经颅磁刺激实现准确的电击。
具体地说,该研究设计了脑区与基因融合的方法,并通过相关分析构建融合特征。这种融合特征被称为脑区-基因对(BR-gene)。提出了一种遗传进化随机森林(GERF)方法,以克服少而高维数据和研究框架不完整的限制。利用GERF模型,提取最可区分的特征作为最优特征。
基于最优特征,对阿尔茨海默病神经成像计划(ADNI)数据库样本的分类正确率达到86.21%,充分说明了GERF方法能够有效地提取特征。此外,还通过优化特征找出了与疾病相关的脑区和危险基因,如罗兰迪氏盖(ROL.L)、额上回、眶部(ORBSU.R)、杏仁核(AMYG)等致病脑区、角回(ANG.R)、额中回、眶部(ORBmid.L)和岛叶(INS.R),以及CNTN5、GRM7和FHIT等危险基因。因此,该研究工作将为研究者探索EMCI提供新的视角。
综上所述,该研究对rs-fMRI和基因数据进行了多模式数据融合研究,以检测脑部疾病。首先,设计了一种融合方法,通过将rs-fMRI数据与基因数据相结合来进行特征融合。其次,提出了GERF方法来寻找最佳的BR-gene对,并有效地对EMCI患者和NC进行分类。与其他方法相比,GERF的分类精度最高。最后,给出了小样本下特征融合、特征提取和分类的总体框架。实验结果表明,整个框架具有出色的特征提取能力和分类性能,为探讨EMCI的发病机制提供了支持。发现了许多与疾病相关的基因和脑区,从而揭示了EMCI的发病机制。
原文出处:
版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
#遗传进化#
76
#Bio#
64
#随机森林#
74
#ALT#
0
#Med#
60