一种知识图谱构建方法及系统与流程
- 国知局
- 2025-01-10 13:11:51
本发明涉及知识图谱领域,具体是一种知识图谱构建方法及系统。
背景技术:
1、现代医学领域面临着大量数据和复杂信息的挑战,医学知识不断更新,新药物、新疗法和新疾病的发现速度很快,知识图谱需要不断更新和维护;知识图谱能够将分散在不同来源的医学信息整合在一起,提供全面的知识视图,通过推理引擎发现隐含关系和新知识,支持临床决策和医学研究,标准化的知识表示方式便于知识共享和复用,促进学术交流和合作;
2、在现有的知识图谱构建过程中,实体之间的关系大多需要人工构建或者依赖固定的逻辑,工作量巨大且难以普遍适用,如何获得实体集合,根据所获得的实体集合构建医学知识图谱,并根据实体集合之间的关系对医学知识图谱进行完善,是我们需要解决的问题,为此,现提供一种知识图谱构建方法及系统。
技术实现思路
1、为了解决上述技术问题,本发明的目的在于提供一种知识图谱构建方法及系统。
2、本发明的第一个目的在于开发一种知识图谱构建方法。
3、本发明的第二个目的在于开发一种知识图谱构建系统。
4、为实现上述第一发明目的,本发明通过以下技术方案实现:一种知识图谱构建方法,包括以下步骤:
5、步骤s1:获取医学数据,并对所获取的医学数据进行预处理,获得标准医学数据;
6、步骤s2:对所获得的标准医学数据进行实体识别,获得若干个实体集合,所述实体集合包括疾病名称集合、药物名称集合、疾病症状集合、手术名称集合以及注意事项集合;
7、步骤s3:根据所获得的实体集合构建医学知识图谱,并根据实体集合之间的关系对医学知识图谱进行完善。
8、进一步的,获取医学数据,并对所获取的医学数据进行预处理的过程包括:
9、从电子健康记录、医学研究论文以及医学数据库中获取医学数据,所述医学数据包括若干个患者的就诊记录;
10、将所获取的医学数据两两之间进行比较,若存在相同的医学数据,则去除重复的医学数据,若不存在相同的医学数据,则对所获取的医学数据进行扫描,判断是否存在含有缺失值的医学数据,若不存在含有缺失值的医学数据,预处理完成,将预处理完成的医学数据记为标准医学数据;
11、若存在含有缺失值的医学数据,则对含有缺失值的医学数据进行二次预处理。
12、进一步的,对含有缺失值的医学数据进行二次预处理的过程包括:
13、将含有缺失值的医学数据删除,并对含有缺失值的医学数据进行二次获取,对二次获取的医学数据进行扫描,判断二次获取的医学数据是否含有缺失值,若二次获取的医学数据含有缺失值,则将二次获取的医学数据删除,若二次获取的医学数据不含有缺失值,二次预处理完成。
14、进一步的,对所获得的标准医学数据进行实体识别的过程包括:
15、通过自然语言处理工具对标准医学数据进行实体识别,获得若干个医学实体,所述医学实体包括疾病名称、药物名称、疾病症状、手术名称以及注意事项,所述注意事项包括药物的注意事项以及手术的注意事项;
16、建立疾病名称集合、药物名称集合、疾病症状集合、手术名称集合以及注意事项集合,所述注意事项集合由药物注意事项子集合和手术注意事项子集合构成;
17、将所获得的疾病名称映射至所建立的疾病名称集合内,将所获得的药物名称映射至所建立的药物名称集合内,将所获得的疾病症状映射至所建立的疾病症状集合内,将所获得的手术名称映射至所建立的手术名称集合内,将所获得的药物的注意事项映射至所建立的药物注意事项子集合内,将所获得的手术的注意事项映射至所建立的手术注意事项子集合内。
18、进一步的,根据所获得的实体集合构建医学知识图谱的过程包括:
19、所述医学知识图谱由疾病名称节点、疾病症状节点、药物名称节点、手术名称节点、药物注意事项节点以及手术注意事项节点构成;
20、将疾病名称节点与疾病症状节点进行连接,将疾病名称节点与药物名称节点进行连接,将疾病名称节点与手术名称节点进行连接,将药物名称节点与药物注意事项节点进行连接,将手术名称节点与手术注意事项节点进行连接;
21、将疾病名称集合映射至疾病名称节点内,将疾病症状集合映射至疾病症状节点内,将药物名称集合映射至药物名称节点内,将手术名称集合映射至手术名称节点内,将药物注意事项子集合映射至药物注意事项节点内,将手术注意事项子集合映射至手术注意事项节点内。
22、进一步的,根据实体集合之间的关系对医学知识图谱进行完善的过程包括:
23、获取疾病名称和疾病症状之间的联系紧密度系数,根据实际情况设置疾病名称和疾病症状之间的联系紧密度系数阈值范围,根据所获得的疾病名称和疾病症状之间的联系紧密度系数以及所设置的疾病名称和疾病症状之间的联系紧密度系数阈值范围,获得疾病名称和疾病症状之间的联系紧密度,所述疾病名称和疾病症状之间的联系紧密度包括一级联系紧密度、二级联系紧密度以及三级联系紧密度;
24、将三级联系紧密度的疾病名称和疾病症状进行虚拟连接,并将三级联系紧密度的疾病名称和疾病症状之间的虚拟连接线进行绿色高亮显示;
25、将二级联系紧密度的疾病名称和疾病症状进行虚拟连接,并将二级联系紧密度的疾病名称和疾病症状之间的虚拟连接线进行橙色高亮显示;
26、将一级联系紧密度的疾病名称和疾病症状进行虚拟连接,并将一级联系紧密度的疾病名称和疾病症状之间的虚拟连接线进行红色高亮显示;
27、获取疾病名称和药物名称之间的联系紧密度系数,根据实际情况设置疾病名称和药物名称之间的联系紧密度系数阈值范围,根据所获得的疾病名称和药物名称之间的联系紧密度系数以及所设置的疾病名称和药物名称之间的联系紧密度系数阈值范围,获得疾病名称和药物名称之间的联系紧密度,所述疾病名称和药物名称之间的联系紧密度包括一级联系紧密度、二级联系紧密度以及三级联系紧密度;
28、将三级联系紧密度的疾病名称和药物名称进行虚拟连接,并将三级联系紧密度的疾病名称和药物名称之间的虚拟连接线进行绿色高亮显示;
29、将二级联系紧密度的疾病名称和药物名称进行虚拟连接,并将二级联系紧密度的疾病名称和药物名称之间的虚拟连接线进行橙色高亮显示;
30、将一级联系紧密度的疾病名称和药物名称进行虚拟连接,并将一级联系紧密度的疾病名称和药物名称之间的虚拟连接线进行红色高亮显示;
31、以此类推,获取疾病名称和手术名称之间的联系紧密度,所述疾病名称和手术名称之间的联系紧密度包括一级联系紧密度、二级联系紧密度以及三级联系紧密度,将对应联系紧密度的疾病名称和手术名称进行虚拟连接。
32、进一步的,获取疾病名称和疾病症状之间的联系紧密度系数的过程包括:
33、根据标准医学数据获取疾病名称和疾病症状同时出现的就诊记录的数量,获取就诊记录的总数量;
34、根据所获取的疾病名称和疾病症状同时出现的就诊记录的数量以及就诊记录的总数量,获得疾病名称和疾病症状之间的联系紧密度系数。
35、基于相同的发明原理,为实现上述第二发明目的,本发明提供一种知识图谱构建系统,采用如第一发明创造所述的一种知识图谱构建方法,包括以下模块:
36、数据采集模块:用于采集医学数据,并对所采集的医学数据进行预处理,获得标准医学数据;
37、数据处理模块,用于对所获得的标准医学数据进行实体识别,获得若干个实体集合,所述实体集合包括疾病名称集合、药物名称集合、疾病症状集合、手术名称集合以及注意事项集合;
38、知识图谱构建模块,用于根据所获得的实体集合构建医学知识图谱,并根据实体集合之间的关系对医学知识图谱进行完善。
39、与现有技术相比,本发明的有益效果是:获取医学数据,并对所获取的医学数据进行预处理,获得标准医学数据,对所获得的标准医学数据进行实体识别,获得若干个实体集合,所述实体集合包括疾病名称集合、药物名称集合、疾病症状集合、手术名称集合以及注意事项集合,根据所获得的实体集合构建医学知识图谱,并根据实体集合之间的关系对医学知识图谱进行完善,充分体现了各个医学实体之间的关联性,对医学实体之间的关系进行了挖掘,能够更加全面、准确地进行医学实体关系预测,进而可以更加完备地构建医学知识图谱。
本文地址:https://www.jishuxx.com/zhuanli/20250110/351572.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。