一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种数据处理方法及装置与流程

2022-07-13 21:56:30 来源:中国专利 TAG:


1.本发明涉及数据处理领域,特别涉及一种数据处理方法及装置。


背景技术:

2.随着数据信息化建设的推进,存在对多个业务平台提供的数据进行融合管理的需求。例如医院或其他具有医疗资质的企业作为多个业务平台,创建了繁多的基于患者的数据系统,每个数据系统积累了大量的数据,其中数据系统间的数据同步工作的重要性和必要性日益凸显。
3.如何在保证数据准确性的前提下实现多业务平台数据融合管理,是目前一项重要的研究。


技术实现要素:

4.有鉴于此,本发明的目的在于提供一种数据处理方法及装置,实现多业务平台数据的准确的统一管理和控制。
5.为实现上述目的,本发明有如下技术方案:
6.本技术实施例提供了一种数据处理方法,其特征在于,包括:
7.在获取来自多个数据平台的多个待处理数据后,将所述待处理数据以键值对的形式存储;所述键值对中的键的命名符合预设规则;
8.响应于来自目标对象的包含预设信息组的数据获取请求,根据存储的所述多个待处理数据确定属于所述预设信息组的增强数据;
9.在对所述增强数据进行脱敏处理得到脱敏数据后,向所述目标对象提供所述脱敏数据。
10.可选的,所述待处理数据具有与所属的数据平台对应的数据权重,所述根据存储的所述多个待处理数据确定属于所述预设信息组的增强数据,包括:
11.从所述待处理数据中确定出数据的键与所述预设信息组匹配的原始数据;
12.根据所述原始数据的数据权重,对所述原始数据中对应第一键的多个待合并数据进行合并,得到所述第一键对应的已合并数据;
13.将所述原始数据中的所述多个待合并数据替换为所述已合并数据,得到新的原始数据;
14.根据所述新的原始数据确定所述增强数据。
15.可选的,所述预设信息组包括所述第一键,所述根据所述原始数据的数据权重,对所述原始数据中对应相同键的多个待合并数据进行合并,得到所述相同键对应的已合并数据,包括:
16.将所述多个第一数据中数据权重最高的数据,作为所述第一键对应的已合并数据;
17.所述根据所述新的原始数据确定所述增强数据,包括:
18.将所述已合并数据确定为所述第一键对应的增强数据。
19.可选的,所述预设信息组包括与所述第一键相关且不存在于所述原始数据组的第二键,所述根据所述原始数据的数据权重,对所述原始数据中对应相同键的多个待合并数据进行合并,得到所述相同键对应的已合并数据,包括:
20.根据所述多个待合并数据的数据权重对所述多个待合并数据进行加权平均,得到所述第一键对应的已合并数据;
21.所述根据所述新的原始数据确定所述增强数据,包括:
22.根据所述已合并数据计算得到所述第一键对应的增强数据。
23.可选的,所述向所述目标对象提供所述脱敏数据,包括:
24.广播所述脱敏数据,和/或,向所述目标对象发送所述脱敏数据。
25.可选的,所述将所述待处理数据以键值对的形式存储之前,所述方法还包括:
26.对所述待处理数据进行校验,确定所述待处理数据的值满足所述待处理数据的字段声明中的值域条件。
27.本技术实施例提供了一种数据处理装置,包括:
28.数据存储单元,用于在获取来自多个数据平台的多个待处理数据后,将所述待处理数据以键值对的形式存储;所述键值对中的键的命名符合预设规则;
29.增强数据获取单元,用于响应于来自目标对象的包含预设信息组的数据获取请求,根据存储的所述多个待处理数据确定属于所述预设信息组的增强数据;
30.脱敏数据获取单元,用于在对所述增强数据进行脱敏处理得到脱敏数据后,向所述目标对象提供所述脱敏数据。
31.可选的,所述待处理数据具有与所属的数据平台对应的数据权重,所述增强数据获取单元,包括:
32.原始数据查找单元,用于从所述待处理数据中确定出数据的键与所述预设信息组匹配的原始数据;
33.数据合并单元,用于根据所述原始数据的数据权重,对所述原始数据中对应第一键的多个待合并数据进行合并,得到所述第一键对应的已合并数据;
34.数据替换单元,用于将所述原始数据中的所述多个待合并数据替换为所述已合并数据,得到新的原始数据;
35.增强数据确定单元,用于根据所述新的原始数据确定所述增强数据。
36.可选的,所述预设信息组包括所述第一键,所述数据合并单元具体用于:
37.将所述多个第一数据中数据权重最高的数据,作为所述第一键对应的已合并数据;
38.所述增强数据确定单元具体用于:
39.将所述已合并数据确定为所述第一键对应的增强数据。
40.可选的,所述预设信息组包括与所述第一键相关且不存在于所述原始数据组的第二键,所述数据合并单元具体用于:
41.根据所述多个待合并数据的数据权重对所述多个待合并数据进行加权平均,得到所述第一键对应的已合并数据;
42.所述增强数据确定单元具体用于:
43.根据所述已合并数据计算得到所述第一键对应的增强数据。
44.可选的,所述脱敏数据获取单元具体用于:
45.广播所述脱敏数据,和/或,向所述目标对象发送所述脱敏数据。
46.可选的,所述装置还包括:
47.校验单元,用于所述将所述待处理数据以键值对的形式存储之前,对所述待处理数据进行校验,确定所述待处理数据的值满足所述待处理数据的字段声明中的值域条件。
48.本技术实施例提供了一种数据处理方法及装置,在获取来自多个数据平台的多个待处理数据后,将待处理数据以键值对的形式存储,键值对中的键的命名符合预设规则,这样可以实现多个数据平台的数据的统一存储,统一的键的命名使存储的待处理数据易于处理,提高待处理数据的处理准确性,响应于来自目标对象的包含预设信息组的数据获取请求,根据存储的多个待处理数据确定属于预设信息组的增强数据,这样可以实现多个数据平台的数据的融合管理,在对增强数据进行脱敏处理得到脱敏数据后,向目标对象提供脱敏数据,从而实现数据的安全性管理,因此本技术实施例可以实现多数据平台的数据的准确融合,且兼顾安全性,实现多业务平台数据的安全准确的统一管理和控制。
附图说明
49.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
50.图1为本技术实施例提供的一种数据处理方法的流程图;
51.图2为本技术实施例提供的一种数据处理装置的结构框图。
具体实施方式
52.为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。
53.在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其它不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
54.随着数据信息化建设的推进,存在对多个业务平台提供的数据进行融合管理的需求。例如医院或其他具有医疗资质的企业作为多个业务平台,创建了繁多的基于患者的数据系统,每个数据系统积累了大量的数据,其中数据系统间的数据同步工作的重要性和必要性日益凸显。
55.目前业内主要采用基于数据库、基于数据中台的解决方案,其中基于数据库的数据管理同步方式,通常采用hive这种有大数据能力的关系型数据库或者mongodb这种非关系性数据库,这些数据库通常由工程师驱动,上层页面系统被动接收数据,在需要进行数据的回传时,需要对接底层数据,这就导致在实际的生产过程中,对数据安全性、准确性(可信度)有着巨大的挑战。在基于数据中台的解决方案中,往往需要强依赖etl(extract-transform-load)的抽取、转换、加载,然而这种解决方案对医疗数据的特殊性和多业务平
台数据融合的规则多样性具有极高的挑战,在需要对医疗数据进行二次计算、周期内变化数据的变化情况、分簇使用等方面,数据中台的实现落地难度较大。
56.如何在保证数据准确性的前提下实现多业务平台数据融合管理,是目前一项重要的研究。
57.基于此,本技术实施例提供了一种数据处理方法及装置,在获取来自多个数据平台的多个待处理数据后,将待处理数据以键值对的形式存储,键值对中的键的命名符合预设规则,这样可以实现多个数据平台的数据的统一存储,统一的键的命名使存储的待处理数据易于处理,提高待处理数据的处理准确性,响应于来自目标对象的包含预设信息组的数据获取请求,根据存储的多个待处理数据确定属于预设信息组的增强数据,这样可以实现多个数据平台的数据的融合管理,在对增强数据进行脱敏处理得到脱敏数据后,向目标对象提供脱敏数据,从而实现数据的安全性管理,因此本技术实施例可以实现多数据平台的数据的准确融合,且兼顾安全性,实现多业务平台数据的安全准确的统一管理和控制。
58.为了更好的理解本发明的技术方案和技术效果,以下将结合附图对具体的实施例进行详细的描述。
59.本技术实施例提供了一种数据处理方法,适用于本技术实施例提供的数据处理系统,数据处理系统包括存储器和用于执行数据处理方法的控制器,参考图1所示,为本技术实施例提供的一种数据处理方法的流程图,该方法可以包括:
60.s101,在获取来自多个数据平台的多个待处理数据后,将待处理数据以键值对的形式存储。
61.s102,响应于来自目标对象的包含预设信息组的数据获取指令,根据存储的待处理数据确定属于预设信息组的增强数据。
62.s103,在对增强数据进行脱敏处理得到脱敏数据后,向目标对象提供脱敏数据。
63.本技术实施例中,待处理数据可以为医疗数据,也可以为其他数据,数据处理系统为待处理数据的管理平台,用于对待处理数据进行管理。多个数据平台为待处理数据的提供平台,用于向数据处理系统提供待处理数据,以待处理数据为医疗数据为例,数据平台可以基于不同业务功能获取到不同的和患者相关的业务数据,这些业务数据作为待处理数据,其中数据平台可以包括健康管理平台、健康审核平台、患者自提交平台等,健康管理平台可以供医生使用并获取来自医生的医疗数据,也可以供医疗实验室使用并获取来自医疗实验室的医疗数据,健康审核平台可以供审核人员使用并获取来自健康审核人员的医疗数据,患者自提交平台可以供患者使用并获取来自患者的医疗数据。通常来说,由于获取途径的差异,健康审核平台获取的待处理数据相较于健康管理平台获取的待处理数据更为可靠,健康管理平台获取的待处理数据相较于患者自提交平台获取的待处理数据更为可靠。
64.在s101中,本技术实施例提供的数据处理系统,可以从数据平台获取待处理数据,从多个数据平台可以获取多个待处理数据,其中,从一个数据平台可以获取一个待处理数据,也可以获取多个待处理数据,从同一数据平台获取或从不通过数据平台获取的待处理数据,均不会互相覆盖,更容易在进行数据处理时进行数据回溯,从而更好的适应医疗数据的变化性。来自于同一数据平台的待处理数据可以为不同时刻产生的(有利于较好的适应医疗数据的变化性),也可以为同一时刻产生的且属于不同患者;来自于不同数据平台的待处理数据可以为不同时刻产生的,也可以为同一时刻产生的,可以属于不同患者,也可以属
于同一患者。例如血压会随着吃药而发生变化,因此可以通过同一数据平台获取同一患者不同时刻产生的血压数据,有利于较好的适应医疗数据的变化性。
65.数据平台可以以服务的形式体现,相关人员(例如医生、患者、健康审核人员)作为数据上传方,可以通过在数据平台上传待处理数据,使待处理数据通过数据平台上传到数据处理系统。例如医生可以通过健康管理平台上传医疗数据,健康审核人员可以通过健康审核平台上传医疗数据,患者可以通过患者自提交平台上传医疗数据,从而体现医疗数据的多源性,全面的医疗数据有利于医学理论的进一步完善。
66.数据平台可以提供注册功能,数据上传方在通过数据平台进行注册时,可以获取到成对的服务标识(id)和服务密钥,数据平台也可以不提供注册功能,数据上传方可以通过数据平台的管理人员进行注册,得到服务标识和服务密钥,数据平台可以具有认证模块,用于提供注册功能。其中,服务标识用于标识数据上传方的身份,还可以标识数据上传方所属的数据平台,服务密钥用于对数据上传方的身份进行鉴别。同一数据上传方可以根据实际业务需求注册得到多个服务标识分别对应多个数据平台,例如医生可以通过健康管理平台对应的服务标识登录并上传处方相关的医疗数据,也可以通过患者自上传平台对应的服务标识登录并上传经过患者签署的医疗数据。
67.数据平台可以提供登录功能,数据上传方通过注册得到的服务标识和服务秘钥可以登录相应的数据平台,进而上传待处理数据,通过对数据上传方的认证保证待处理数据的来源的可靠性,数据平台可以具有认证模块,用于提供登录功能。确定对数据上传方的登录信息认证通过后,还可以为数据上传方提供历史上传的数据信息。具体的,数据平台可以提供多种登录途径,以供属于不同数据平台的数据上传方登录;数据平台也可以提供同一种登录途径,不同数据平台的数据上传方登录后,可以根据其服务标识确定其所属的数据平台。
68.由于不同数据来源往往具有不同的可靠程度,因此可以为不同数据来源的待处理数据确定数据权重,可靠程度较高的待处理数据可以具有较高的权重,可靠程度较低的待处理数据可以具有较低的数据权重,从而较大程度的保证数据的准确性和可用性,数据权重根据数据来源自动生成,具有较高的便利性。例如,来自患者自上传平台的待处理数据可以具有第一权重,来自健康管理平台的待处理数据可以具有第二权重,来自健康审核平台的待处理数据可以具有第三权重,作为一种示例,第一权重可以为1,第二权重可以为2,第三权重可以为3。
69.在s101中,在获取来自多个数据平台的多个待处理数据后,可以将待处理数据以键(key)值(value)对的形式存储,这样实现多个数据平台的数据的统一存储。具体的,来自多个数据平台的多个待处理数据可以通过消息队列或接口流向数据处理系统,数据处理系统可以包括适配模块,用于对该消息队列进行监听,以更好的控制待处理数据的上传。数据处理系统可以包括存储控制模块,用于将待处理数据存储到存储设备中。
70.待处理数据可以分为属性和事件两类,根据待处理数据的数据类型(data_type)字段来表征待处理数据的类型,例如数据类型字段为1表征待处理数据的类别为属性,数据类型字段为2表征待处理数据的类别为事件。以医疗数据为例,患者的出生日期可以作为一个类型为属性的待处理数据,data_type为1,键(也称为key字段)的名称为birth_date,值为日期。
71.待处理数据的数据类型为事件时,待处理数据可以为多个类型为属性的子数据的集合,当然,类型为属性的子数据本身可以作为一个事件,从而使事件和属性嵌套,待处理数据可以具有属性列表(value_list),用于表示待处理数据包含的多个类型为属性的子数据。例如血常规检查可以作为一个数据类型为事件的待处理数据,data_type为2,键的名称为blood_routine,该事件可以包括rbc、hb、wbc、plt等类型为属性的子数据。
72.待处理数据的键具有字段声明,用于对待处理数据的键进行定义,字段声明可以包括键的名称、待处理数据的名称、简要描述、额外属性、值的数据类型等,其中额外属性可以包括值域条件,用于对值域进行限定,以便据此对待处理数据进行校验,额外属性例如可以限定值的数据单位、数据正常范围等,格式可以为fson格式,值的数据类型定义了值的字符串格式,可以包括string、float、int、date、list、dict等。
73.数据上传方在上传待处理数据时,可以查询待处理数据中的键是否被定义,若有定义,则说明数据处理系统中存在该键的字段声明,可以直接进行待处理数据的上传,若无定义,则需要提供相应的字段声明,数据处理系统中的键的定义可以由数据处理系统的管理人员生成,数据处理系统可以具有原始数据管理模块,用于管理键的定义。在数据处理系统中,键值对中的键的命名符合预设规则,实际操作中,同一含义的键原则上需要做到统一,键的字段需要尽量见名知意,涉及到医学字段,可以参考国际疾病分类系统(idc10)和医学类人员的通用名称。例如birth_date和birth_day两个字段均表示出生年月日时,这两个字段通常不能统一合并,不符合设计原则,当然,若这两个字段对应的待处理数据的字段声明中除键的名称之外的其他信息均一致,也可以认为这两个字段是同一含义,可以对该字段进行调整使其统一。
74.具体的,待处理数据的额外属性可以包括值域字典(value_map)作为值域条件,例如键为婚姻状态(marital_status),其额外属性为{"value_map":{"1":"未婚未育","2":"已婚已育","3":"已婚未孕","4":"离异"}},则定义了多种婚姻状态对应的标识,则待处理数据的值可以为这些标识中的其中一个而不能为其他值,可以为整形或字符串格式,而不能是其他格式,例如未婚未育对应的标识为“1”。或者,待处理数据的额外属性可以包括值域区间(valid_range)作为值域条件,例如键为心率(heart_rate),其额外属性为{"unit":"次/分","valid_range":[30,600]},则定义了心率的数值范围,该数值的格式可以为整形或字符串格式,而不能是其他格式。又或者,待处理数据的额外属性可以包括属性列表作为值域条件,例如键为血常规检查(blood_routine),值的类型为list类型,其额外属性为{"value_list":["rbc","hb","wbc","plt"]},则定义了包含的子数据的键作为该待处理数据的值,其中rbc、hb、wbc、plt均为定义好的属性类型字段。
[0075]
参见表1所示,为本技术实施例提供的一种字段声明的示例,其中以出生日期和wbc为例。
[0076]
表1字段声明的示例
[0077][0078]
在获取到待处理数据后,还可以对待处理数据的合规性进行校验,从而确定待处理数据是否符合预设规则,若待处理数据不符合预设规则,可以不进行待处理数据的存储,若待处理数据符合预设规则,可以将待处理数据以键值对的形式存储。数据处理系统可以具有原始数据管理模块,用于提供合规性校验功能。对待处理数据的校验主要包括对键值对中的键的命名的校验,以及对键值对中的值的校验。
[0079]
具体的,若获取的待处理数据的键的名称在数据处理系统中未被定义且待处理数据中不包含字段声明,则确定待处理数据的键的名称不符合预设规则,确定待处理数据的针对键的合规性校验不通过,例如系统定义了birth_date,待处理数据中包含键birth_day,且未被该字段进行定义,则认为待处理数据不符合规则。反之,若获取的待处理数据的键的名称在数据处理系统中已被定义或待处理数据中包含字段声明,则确定待处理数据的键的名称符合预设规则,待处理数据的针对键的合规性校验通过,统一的键的命名使存储的待处理数据易于处理,提高待处理数据的处理准确性。
[0080]
具体的,若获取的待处理数据的值满足待处理数据的字段声明中的值域条件,则确定待处理数据的值符合预设规则,待处理数据的针对值的合规性校验通过;反之,若获取的待处理数据的值不满足待处理数据的字段声明中的值域条件,则确定待处理数据的值不符合预设规则,待处理数据的针对值的合规性校验不通过。例如birth_date的值的数据格式要求为xxxx-xx-xx,而待处理数据中的birth_date的值为“二零二一年十月一日”,则该值不符合预设规则,该数据针对值的校验不通过。
[0081]
对待处理数据的合规性的校验可以根据相应的额外属性进行通用判定,也可以利用校验代码块对待处理数据进行校验,校验代码块规则可以通过字段声明定义,这样在通用判定方法无法实现的情况下,可以利用校验代码块对待处理数据进行校验。当然,在存在校验代码块时,也可对待处理数据进行通用判定。
[0082]
具体实施时,校验代码块的设定规则可以包括:1)代码符合python3语法(return返回值除外);2)其中最后需要用return返回值(想象所有提交的代码是在一个函数中),此返回值将会作为计算值的结果;3)代码可以考虑到异常情况,也可以不考虑,考虑时会有兜底策略;4)如果不设置默认值`default_value`,那么如果出错,将不会更新值,其他情况均会更新数值;5)代码中禁止含有`"exec","eval","import","__import__","global"`字符串;6)需要导入的包,需要在白名单中,由另一个参数(`need_pkg`)传入;7)缩进tab会替换为4个空格。以下为一种校验代码块的示例:
[0083][0084][0085]
在s102中,响应于来自目标对象的包含预设信息组的数据获取指令,可以根据存储的待处理数据确定属于预设信息组的增强数据,实现待处理数据的融合管理。
[0086]
本技术实施例中,可以利用数据获取指令,根据待处理数据确定增强数据。数据获取指令可以根据数据使用方的指示生成,数据使用方是具有使用待处理数据的需求的用户,可以是不同于数据上传方的用户,也可以是数据上传方,也就是说,同一用户可以根据其对待处理数据的上传操作而被确定为数据上传方,也可以根据其对待处理数据的获取操作为被确定为数据使用方。本技术实施例中,目标对象作为数据使用方。
[0087]
数据使用方也可以通过本技术实施例提供的数据处理系统进行注册和登录,数据处理系统可以对数据适用方的身份进行认证。在对数据使用方认证通过后,可以获取来自数据使用方的预设信息组,预设信息组可以以逻辑结构模式(schema)信息的形式被定义,数据处理系统可以包括增强数据管理模块,数据使用方可以通过增强数据管理模块定义预设信息组,以便进行数据的调用。预设信息组可以预先定义,可以人为确定,也可以根据规则对数据的键进行组合得到,预设信息组中每个键根据类型不同有不同的必要属性作为该键的值,例如预设信息组可以为基础信息组,基础信息组可以包括姓名、性别、出生日期、身高、体重、体脂率等多个键;预设信息组也可以为血常规信息组,血常规信息组可以包括wbc、rbc、plt等多个键。若预设信息组为基础信息组,则增强数据为患者的姓名、性别、出生日期、身高、体重、体脂率等多个键对应的值。
[0088]
待处理数据具有与所属的数据平台对应的数据权重时,可以根据待处理数据的数据权重确定增强数据。具体的,可以先从待处理数据中确定数据的键与预设信息组匹配的原始数据,之后根据原始数据的数据权重,对原始数据中对应第一键的多个待合并数据进行合并,得到第一键对应的已合并数据,在将原始数据中的多个待合并数据替换为已合并数据后,得到新的原始数据,根据新的原始数据确定增强数据。其中与预设信息组匹配的原始数据,可以通过增强数据管理模块获取得到。
[0089]
其中,根据原始数据的数据权重,对原始数据中对应第一键的多个待合并数据进行合并,得到第一键对应的已合并数据,可以具体为,将多个待合并数据中数据权重最高的数据,作为第一键对应的已合并数据,这样可以将准确性最高的数据作为第一键对应的已合并数据,或者根据多个待合并数据的数据权重对多个待合并数据进行加权平均,得到第一键对应的已合并数据,这样可以综合考虑各个数据得到第一键对应的已合并数据。
[0090]
在根据待处理数据的数据权重确定增强数据之前,还可以确定数据获取请求针对的增强数据的数据类型,增强数据的数据类型可以包括非计算类和计算类。其中,增强数据
的数据类型为非计算类时,预设信息组中的键存在于原始数据中,无需计算即可直接将原始数据作为对应的增强数据,例如增强数据包括身高、出生日期等非计算类数据;增强数据的数据类型为计算类时,预设信息组中的键不存在于原始数据中,需要通过原始数据中的数据进行计算得到对应的增强数据,例如增强数据包括身体质量指数(body mass index,bmi)等计算类数据,bmi需要通过身高和体重计算得到。
[0091]
数据获取请求针对的增强数据的数据类型可以通过数据获取请求的类型标识确定,非计算类对应第一类型标识,计算类对应第二类型标识,例如第一类型标识为1,第二类型标识为2。数据获取请求针对的增强数据的数据类型为计算类时,该数据获取请求还对应有计算代码、导入包列表、默认值信息、计算频率、参数列表等,其中参数列表中可以包括至少一个增强数据的键。
[0092]
具体的,若数据获取请求针对非计算类数据,以预设信息组中的第一键为例,原始数据中包括第一键对应的多个待合并数据,在将多个待合并数据替换为第一键对应的已合并数据后,可以将第一键对应的已合并数据作为第一键对应的增强数据。例如第一键为姓名、性别、出生日期、体重或身高等。当然已合并数据可以为多个待合并数据中数据权重最高的数据,也可以为多个待合并数据加权得到的加权数据。同理,若数据获取请求针对非计算类数据,以预设信息组中的第三键为例,原始数据中包括第三键对应的一个数据,则可以将该数据作为第三键对应的增强数据。例如第三键为姓名、性别、出生日期、体重或身高等。
[0093]
具体的,若数据获取请求针对计算类数据,以预设信息组中的第二键为例,第二键与第一键相关且不存在于原始数据中,原始数据中包括第一键对应的多个待合并数据,在将多个待合并数据替换为第一键对应的已合并数据后,可以根据第一键对应的已合并数据计算第一键对应的增强数据。当然已合并数据可以为多个待合并数据中数据权重最高的数据,也可以为多个待合并数据加权得到的加权数据。根据第一键对应的已合并数据计算第一键对应的增强数据,可以具体为,根据第一键对应的已合并数据和计算策略确定第一键对应的增强数据,或根据第一键对应的已合并数据、第四键对应的数据和计算策略确定第一键对应的增强数据,其中第四键对应的数据可以为原始数据,也可以为已合并数据,计算策略可以通过计算代码确定。例如第二键为bmi,第一键为身高,第四键为体重。
[0094]
同理,若数据获取请求针对计算类数据,以预设信息组中的第五键为例,第五键与第三键相关且不存在于原始数据中,原始数据中包括第三键对应的一个数据,则可以根据该数据计算第五键对应的增强数据。根据改数据计算第五键对应的增强数据,可以具体为,根据该数据和计算策略确定第五键对应的增强数据,或根据该数据、第六键对应的数据和计算策略确定第五键对应的增强数据,其中第六键对应的数据可以为原始数据,也可以为已合并数据,计算策略可以通过计算代码确定。例如第五键为bmi,第三键为身高,第六键为体重。
[0095]
此外,在确定增强数据后,若监听到该原始数据存在更新,可以根据更新后的原始数据确定新的增强数据,原始数据的更新通过由数据平台上传新的与增强数据相关的待处理数据触发。具体的,新的原始数据可以作为新的待合并数据,根据新的待合并数据确定新的已合并数据,并根据新的已合并数据确定新的增强数据。例如已合并数据为数据权重最高的待合并数据,且新的原始数据的数据权重大于已合并数据的数据权重,则可以将新的原始数据作为新的已合并数据,新的已合并数据可以作为新的增强数据,也可以作为新的
增强数据的计算依据。
[0096]
需要说明的是,可以为增强数据确定值域条件,若计算得到的增强数据不满足该值域条件,则可以将该数据记为异常数据,或可以将该数据的值调整为预先设置的默认值,默认值根据预先设置的兜底策略确定。
[0097]
如上所述,同一原始数据可以对应一个增强数据,也可以对应多个增强数据,提高待处理数据的可统筹性,提高数据处理的优化空间。此外,在生成增强数据后,可以对增强数据进行存储,增强数据可以作为下次计算增强数据的原始数据,以得到新的增强数据。计算得到增强数据的步骤可以通过数据处理系统中的计算模块实现,计算模块可以为独立的计算部件,便于增加计算能力,也可以为数据处理系统中的具有计算功能的功能模块。
[0098]
在s103中,在对增强数据进行脱敏处理得到脱敏数据后,可以向目标对象提供脱敏数据,经过脱敏处理的脱敏数据提供给目标对象,减少了敏感数据的外泄,提高数据处理系统中的数据的安全性,从而实现数据的安全性管理以及精准的数据提供。对增强数据进行的脱敏处理,可以根据预先定义的脱敏规则进行,不同的目标对象所对应的脱敏规则可以不同,脱敏处理可以由数据处理系统中的脱敏模块实现。
[0099]
向目标对象提供脱敏数据可以具体为,广播脱敏数据,和/或,向目标对象发送脱敏数据。广播脱敏数据,可以通过数据处理系统中的广播模块实现。实际操作中,可以先向目标对象发送脱敏数据,再通过广播的形式监听脱敏数据的变化,再脱敏数据存在变化时,通过广播向目标对象提供新的脱敏数据,以使目标对象获取准确的脱敏数据。
[0100]
本技术实施例提供了一种数据处理方法,在获取来自多个数据平台的多个待处理数据后,将待处理数据以键值对的形式存储,键值对中的键的命名符合预设规则,这样可以实现多个数据平台的数据的统一存储,统一的键的命名使存储的待处理数据易于处理,提高待处理数据的处理准确性,响应于来自目标对象的包含预设信息组的数据获取请求,根据存储的多个待处理数据确定属于预设信息组的增强数据,这样可以实现多个数据平台的数据的融合管理,在对增强数据进行脱敏处理得到脱敏数据后,向目标对象提供脱敏数据,从而实现数据的安全性管理,因此本技术实施例可以实现多数据平台的数据的准确融合,且兼顾安全性,实现多业务平台数据的安全准确的统一管理和控制。
[0101]
基于本技术实施例提供的一种数据处理方法,本技术实施例还提供了一种数据处理装置,参考图2所示,为本技术实施例提供的一种数据处理装置的结构框图,该装置可以包括:
[0102]
数据存储单元110,用于在获取来自多个数据平台的多个待处理数据后,将所述待处理数据以键值对的形式存储;所述键值对中的键的命名符合预设规则;
[0103]
增强数据获取单元120,用于响应于来自目标对象的包含预设信息组的数据获取请求,根据存储的所述多个待处理数据确定属于所述预设信息组的增强数据;
[0104]
脱敏数据获取单元130,用于在对所述增强数据进行脱敏处理得到脱敏数据后,向所述目标对象提供所述脱敏数据。
[0105]
可选的,所述待处理数据具有与所属的数据平台对应的数据权重,所述增强数据获取单元,包括:
[0106]
原始数据查找单元,用于从所述待处理数据中确定出数据的键与所述预设信息组匹配的原始数据;
[0107]
数据合并单元,用于根据所述原始数据的数据权重,对所述原始数据中对应第一键的多个待合并数据进行合并,得到所述第一键对应的已合并数据;
[0108]
数据替换单元,用于将所述原始数据中的所述多个待合并数据替换为所述已合并数据,得到新的原始数据;
[0109]
增强数据确定单元,用于根据所述新的原始数据确定所述增强数据。
[0110]
可选的,所述预设信息组包括所述第一键,所述数据合并单元具体用于:
[0111]
将所述多个第一数据中数据权重最高的数据,作为所述第一键对应的已合并数据;
[0112]
所述增强数据确定单元具体用于:
[0113]
将所述已合并数据确定为所述第一键对应的增强数据。
[0114]
可选的,所述预设信息组包括与所述第一键相关且不存在于所述原始数据组的第二键,所述数据合并单元具体用于:
[0115]
根据所述多个待合并数据的数据权重对所述多个待合并数据进行加权平均,得到所述第一键对应的已合并数据;
[0116]
所述增强数据确定单元具体用于:
[0117]
根据所述已合并数据计算得到所述第一键对应的增强数据。
[0118]
可选的,所述脱敏数据获取单元具体用于:
[0119]
广播所述脱敏数据,和/或,向所述目标对象发送所述脱敏数据。
[0120]
可选的,所述装置还包括:
[0121]
校验单元,用于所述将所述待处理数据以键值对的形式存储之前,对所述待处理数据进行校验,确定所述待处理数据的值满足所述待处理数据的字段声明中的值域条件。
[0122]
本技术实施例提供了一种数据处理装置,在获取来自多个数据平台的多个待处理数据后,将待处理数据以键值对的形式存储,键值对中的键的命名符合预设规则,这样可以实现多个数据平台的数据的统一存储,统一的键的命名使存储的待处理数据易于处理,提高待处理数据的处理准确性,响应于来自目标对象的包含预设信息组的数据获取请求,根据存储的多个待处理数据确定属于预设信息组的增强数据,这样可以实现多个数据平台的数据的融合管理,在对增强数据进行脱敏处理得到脱敏数据后,向目标对象提供脱敏数据,从而实现数据的安全性管理,因此本技术实施例可以实现多数据平台的数据的准确融合,且兼顾安全性,实现多业务平台数据的安全准确的统一管理和控制。
[0123]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其它实施例的不同之处。
[0124]
以上所述仅是本发明的优选实施方式,虽然本发明已以较佳实施例披露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何的简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献