医学数据处理方法、装置、电子设备及计算机可读介质与流程
- 国知局
- 2024-11-18 18:22:24
本技术涉及人工智能、大数据及医疗健康,尤其涉及一种医学数据处理方法、装置、电子设备及计算机可读介质。
背景技术:
1、目前,在医学内容标签标注的领域,标签如疾病、科室、症状、药品等,是用于分类和索引医疗信息的关键词汇。这些标签对于提高医疗信息检索的效率和准确性至关重要。首先,传统的人工标注方案虽然可以达到较高的准确性,但面临着人力成本高昂、效率低下、难以快速扩展到大规模数据集的问题。其次,现有的自动标注方案虽然能够一定程度上降低成本和提高效率,但通常遭受训练成本高、模型更新维护困难、以及在特定医学领域内准确性和专业性不足的问题。不准确的标注会直接影响用户检索和使用医疗信息的效率,尤其是在决策敏感的医疗领域,这种影响尤为重要。
技术实现思路
1、有鉴于此,本技术实施例提供一种医学数据处理方法、装置、电子设备及计算机可读介质,能够解决现有的不准确的标注会直接影响用户检索和使用信息的效率的问题。
2、为实现上述目的,根据本技术实施例的一个方面,提供了一种医学数据处理方法,包括:接收数据处理请求,获取医学文本数据,提取医学文本数据中的异常实体;基于异常实体匹配向量库表,以获取匹配到的结构化异常数据;基于结构化异常数据和知识图谱,得到第一匹配结果数据;对医学文本数据中的标题进行向量化处理,以得到标题向量,将标题向量与向量库表中的各个向量子空间基于倒排索引乘积量化索引方法进行匹配,以得到第二匹配结果数据;基于第一匹配结果数据和第二匹配结果数据,通过加权特征的线性组合计算得到综合决策结果数据。
3、可选地,提取医学文本数据中的异常实体,包括:提取医学文本数据中的异常内容数据;基于异常内容数据,生成引导提示词;将引导提示词输入至大语言模型,以得到对应的异常实体。
4、可选地,基于异常实体匹配向量库表,以获取匹配到的结构化异常数据,包括:对异常实体进行向量化处理,以得到异常实体向量;计算异常实体向量与向量库表中的各个异常向量的相似度,基于相似度和预设阈值,确定目标异常向量;将向量库表中与目标异常向量对应的标签确定为与异常实体匹配的结构化异常数据。
5、可选地,基于结构化异常数据和知识图谱,得到第一匹配结果数据,包括:将结构化异常数据作为查询条件,应用于知识图谱,以获取相应的第一匹配结果数据。
6、可选地,得到第二匹配结果数据,包括:将标题向量与向量库表中的各个向量子空间基于倒排索引进行聚类,以得到各个聚类簇;对于每个聚类簇,对所对应的标题向量和向量子空间做乘积量化,以得到第二匹配结果数据。
7、可选地,基于第一匹配结果数据和第二匹配结果数据,通过加权特征的线性组合计算得到综合决策结果数据,包括:获取第一匹配结果数据和第二匹配结果数据中的每一个标签对应的特征函数所对应的权重值;对于每一个标签,计算特征函数和权重值的乘积;根据乘积,确定所对应的标签的综合决策值;根据各个综合决策值,确定综合决策结果数据。
8、可选地,方法还包括:响应于检测到关系型数据暂存库中发生数据变更,通过逻辑日志机制,确定变更数据;基于变更数据,生成消息队列,实时发送消息队列至消息中间件;调用业务应用以根据预设的消息队列消费规则,从消息中间件中实时消费数据变更消息,执行相应的业务逻辑处理,得到业务逻辑处理结果;根据业务逻辑处理结果,更新向量库表。
9、另外,本技术还提供了一种医学数据处理装置,包括:接收单元,被配置成接收数据处理请求,获取医学文本数据,提取医学文本数据中的异常实体;获取单元,被配置成基于异常实体匹配向量库表,以获取匹配到的结构化异常数据;第一匹配单元,被配置成基于结构化异常数据和知识图谱,得到第一匹配结果数据;第二匹配单元,被配置成对医学文本数据中的标题进行向量化处理,以得到标题向量,将标题向量与向量库表中的各个向量子空间基于倒排索引乘积量化索引方法进行匹配,以得到第二匹配结果数据;计算单元,被配置成基于第一匹配结果数据和第二匹配结果数据,通过加权特征的线性组合计算得到综合决策结果数据。
10、可选地,接收单元进一步被配置成:提取医学文本数据中的异常内容数据;基于异常内容数据,生成引导提示词;将引导提示词输入至大语言模型,以得到对应的异常实体。
11、可选地,获取单元进一步被配置成:对异常实体进行向量化处理,以得到异常实体向量;计算异常实体向量与向量库表中的各个异常向量的相似度,基于相似度和预设阈值,确定目标异常向量;将向量库表中与目标异常向量对应的标签确定为与异常实体匹配的结构化异常数据。
12、可选地,第一匹配单元进一步被配置成:将结构化异常数据作为查询条件,应用于知识图谱,以获取相应的第一匹配结果数据。
13、可选地,第二匹配单元进一步被配置成:将标题向量与向量库表中的各个向量子空间基于倒排索引进行聚类,以得到各个聚类簇;对于每个聚类簇,对所对应的标题向量和向量子空间做乘积量化,以得到第二匹配结果数据。
14、可选地,计算单元进一步被配置成:获取第一匹配结果数据和第二匹配结果数据中的每一个标签对应的特征函数所对应的权重值;对于每一个标签,计算特征函数和权重值的乘积;根据乘积,确定所对应的标签的综合决策值;根据各个综合决策值,确定综合决策结果数据。
15、可选地,医学数据处理装置还包括更新单元,被配置成:响应于检测到关系型数据暂存库中发生数据变更,通过逻辑日志机制,确定变更数据;基于变更数据,生成消息队列,实时发送消息队列至消息中间件;调用业务应用以根据预设的消息队列消费规则,从消息中间件中实时消费数据变更消息,执行相应的业务逻辑处理,得到业务逻辑处理结果;根据业务逻辑处理结果,更新向量库表。
16、另外,本技术还提供了一种数据处理电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上述的医学数据处理方法。
17、另外,本技术还提供了一种计算机可读介质,其上存储有计算机程序,程序被处理器执行时实现如上述的医学数据处理方法。
18、为实现上述目的,根据本技术实施例的又一个方面,提供了一种计算机程序产品。
19、本技术实施例的一种计算机程序产品,包括计算机程序,程序被处理器执行时实现本技术实施例提供的医学数据处理方法。
20、上述发明中的一个实施例具有如下优点或有益效果:本技术通过接收数据处理请求,获取医学文本数据,提取医学文本数据中的异常实体;基于异常实体匹配向量库表,以获取匹配到的结构化异常数据;基于结构化异常数据和知识图谱,得到第一匹配结果数据;对医学文本数据中的标题进行向量化处理,以得到标题向量,将标题向量与向量库表中的各个向量子空间基于倒排索引乘积量化索引方法进行匹配,以得到第二匹配结果数据;基于第一匹配结果数据和第二匹配结果数据,通过加权特征的线性组合计算得到综合决策结果数据。提高数据标注相关的数据处理的准确性和可靠性,从而提高用户基于标注的数据检索和使用信息的效率。
21、上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
本文地址:https://www.jishuxx.com/zhuanli/20241118/328486.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表