技术新讯 > 医药医疗技术的改进,医疗器械制造及应用技术 > 一种基于软路径成本累积的冠心病早期筛查特征选择方法  >  正文

一种基于软路径成本累积的冠心病早期筛查特征选择方法

  • 国知局
  • 2024-11-06 14:42:57

本发明属于医疗数据处理,更具体地,涉及一种基于软路径成本累积的冠心病早期筛查特征选择方法。

背景技术:

1、在早期阶段,冠心病通常无显著症状,因此为高风险群体确定并实施预防策略显得尤为重要。传统的医疗评估方法通过综合各种临床指标来评估冠心病风险。然而,由于人体是一个高度复杂的生物系统,许多诊断指标间存在相互关联,常导致重复性诊断和医疗资源的不必要浪费。特征选择技术通过识别关键信息,为患者提供更精确、高效的诊断方案。在用于冠心病诊断的特征选择算法中,大致可以分为过滤器方法、包装器方法和嵌入式方法。过滤器方法因不依赖于任何分类器的结果而广泛应用于大规模医疗数据集,其基于统计方法的原理提供了更快的训练速度和更低的计算成本。

2、尽管如此,现有基于过滤器的冠心病早期筛查预测模型大多仅考虑单一诊断指标与冠心病之间的关系,未能充分利用多个诊断指标间的交互作用,这限制了模型的预测能力。尽管有部分方法考虑了诊断指标间的交互作用,但多数只考虑到一对诊断指标间的交互作用,没有利用上多个诊断指标间复杂的关系。因此,开发一种新的特征选择方法,能够深入分析并利用这些交互作用,对于提高冠心病预测模型的准确性和降低医疗成本具有重要价值。

技术实现思路

1、针对现有技术的缺陷和改进需求,本发明提供了一种基于软路径成本累积的冠心病早期筛查特征选择方法,其目的在于通过充分利用多个诊断指标间的交互作用,来提高冠心病早期筛查特征选择的准确性和效率,从而可用于提升冠心病早期筛查预测模型的准确性和效率。

2、为实现上述目的,按照本发明的一个方面,提供了一种基于软路径成本累积的冠心病早期筛查特征选择方法,包括:s1,以软路径成本累积函数最大为目标,从候选特征集中筛选一待选冠心病早期特征加入已选特征集,并将筛选出的待选冠心病早期特征从候选特征集中移除;s2,计算当前的已选特征集对全部数据集的信息增益比与加入前的已选特征集对全部数据集的信息增益比之间的差值,作为停止评分函数;s3,重复执行所述s1-s2,直至连续k次得到的停止评分函数小于0,k为设定超参数阈值,或者候选特征集为空;s4,将最大停止评分函数对应的当前的已选特征集作为最佳冠心病早期特征集。

3、更进一步地,所述软路径成本累积函数为:

4、

5、其中,spa为所述软路径成本累积函数,fi为已选特征集中已选的冠心病早期特征,fj为待选冠心病早期特征,c为类别标签,best为已选特征集,mie(fj,c)为fj和c之间的互信息均衡度,rel(fi,fj,c)为fi、fj和c之间的相互作用度量。

6、更进一步地,rel(fi,fj,c)为:

7、

8、其中,i(fi,fj,c)为fi、fj和c的三向交互互信息,mie(fi,fj)为fi和fj之间的互信息均衡度。

9、更进一步地,mie(fi,fj)、mie(fj,c)分别为:

10、

11、

12、其中,i(fi,fj)为fi和fj之间的互信息,i(fj,c)为fj和c之间的互信息,h(fi)为fi的熵,h(fj)为fj的熵,h(c)为c的熵。

13、更进一步地,所述停止评分函数为:

14、score=gr(d,best)-gr(d,best_before)

15、

16、

17、其中,score为所述停止评分函数,gr(d,best)为当前的已选特征集对全部数据集的信息增益比,gr(d,best_before)为加入前的已选特征集对全部数据集的信息增益比,g(d,best)为当前的已选特征集对全部数据集的信息增益,hbest(d)为当前的已选特征集对全部数据集的信息熵,g(d,best_before)为加入前的已选特征集对全部数据集的信息增益,hbest_before(d)为加入前的已选特征集对全部数据集的信息熵,d为全部数据集,best为当前的已选特征集,best_before为加入前的已选特征集。

18、更进一步地,所述s1之前还包括:获取冠心病数据集,所述冠心病数据集中的样本包含多个待筛选冠心病早期特征以及相应的类别标签,所述类别标签指示是否患有冠心病;对所述冠心病数据集依次进行数据清洗、去除空缺值和数据离散化处理,得到初始的候选特征集。

19、按照本发明的另一个方面,提供了一种基于软路径成本累积的冠心病早期筛查特征选择系统,包括:处理器;存储器,其存储有计算机可执行程序,所述程序在被所述处理器执行时,使得所述处理器执行如上所述的基于软路径成本累积的冠心病早期筛查特征选择方法。

20、按照本发明的另一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上所述的基于软路径成本累积的冠心病早期筛查特征选择方法。

21、总体而言,通过本发明所构思的以上技术方案,能够取得以下有益效果:

22、(1)提供了一种基于软路径成本累积的冠心病早期筛查特征选择方法,以软路径成本累积函数最大为目标筛选特征,可以评估多个诱因间的相互作用,更符合冠心病的诱因间的复杂关系,提供了更高的冠心病早期筛查特征选择效率和稳定性;

23、在停止选择特征中使用停止评分函数监测新加入特征的影响,确保每一步迭代都朝向提高整体模型性能的方向发展,这种迭代过程允许模型在特征空间中自适应地寻找最优解,而非依赖预设的固定规则;并且由于动态的停止条件,该方法可以根据不同数据集的特性调整迭代过程和特征选择策略,具有高度的适应性和灵活性;

24、(2)通过引入相互作用度量rel(fi,fj,c)和软路径成本累积函数spa,实现了在保持特征间相关性的同时减少冗余性,有效减少了在冠心病早期筛查中不必要的特征,同时保留了具有高交互作用价值的特征,有效量化了特征间的交互作用;

25、(3)软路径特征选择(spfs)算法通过精确平衡各特征的相关性与冗余性,并利用软路径累积技术全面考量特征间的相互关系,从而选出最具代表性的冠心病特征集合,这一过程不仅优化了医疗资源的配置,还确保了高风险患者能够及时接受精确的诊断,显著提高了医疗服务的价值与效率。

技术特征:

1.一种基于软路径成本累积的冠心病早期筛查特征选择方法,其特征在于,包括:

2.如权利要求1所述的基于软路径成本累积的冠心病早期筛查特征选择方法,其特征在于,所述软路径成本累积函数为:

3.如权利要求2所述的基于软路径成本累积的冠心病早期筛查特征选择方法,其特征在于,rel(fi,fj,c)为:

4.如权利要求3所述的基于软路径成本累积的冠心病早期筛查特征选择方法,其特征在于,mie(fi,fj)、mie(fj,c)分别为:

5.如权利要求1所述的基于软路径成本累积的冠心病早期筛查特征选择方法,其特征在于,所述停止评分函数为:

6.如权利要求1-5任一项所述的基于软路径成本累积的冠心病早期筛查特征选择方法,其特征在于,所述s1之前还包括:

7.一种基于软路径成本累积的冠心病早期筛查特征选择系统,其特征在于,包括:

8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-6中任一项所述的基于软路径成本累积的冠心病早期筛查特征选择方法。

技术总结本发明公开了一种基于软路径成本累积的冠心病早期筛查特征选择方法,属于医疗数据处理技术领域,方法包括:S1,以软路径成本累积函数最大为目标,从候选特征集中筛选一待选冠心病早期特征加入已选特征集,并将筛选出的待选冠心病早期特征从候选特征集中移除;S2,计算当前的已选特征集对全部数据集的信息增益比与加入前的已选特征集对全部数据集的信息增益比之间的差值,作为停止评分函数;S3,重复执行S1‑S2,直至连续k次得到的停止评分函数小于0,k为设定超参数阈值,或者候选特征集为空;S4,将最大停止评分函数对应的当前的已选特征集作为最佳冠心病早期特征集。该方法可提升冠心病早期筛查预测模型的准确性和效率。技术研发人员:侯文广,江嘉瑶,朱红玲,王炎,汪道文,丁虎受保护的技术使用者:华中科技大学技术研发日:技术公布日:2024/11/4

本文地址:https://www.jishuxx.com/zhuanli/20241106/323707.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。