一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

数据表合并方法、装置、设备及存储介质与流程

2022-05-18 11:23:03 来源:中国专利 TAG:


1.本发明涉及数据处理技术领域,尤其涉及一种数据表合并方法、装置、设备及存储介质。


背景技术:

2.在实时指标开发过程中,为了提高开发效率,通常会将不同指标分发给不同的开发团队进行开发,因此,在对指标数据进行挖掘过程中,通常会有将数据表进行关联合并的需求。目前,通常采用维表拼接的方式实现数据表的合并,然而,由于这种方式会导致合并复杂性增加,造成数据表合并效率下降,不利于实时挖掘出有效信息。


技术实现要素:

3.鉴于以上内容,有必要提供一种数据表合并方法、装置、设备及存储介质,能够提高数据表合并效率。
4.一方面,本发明提出一种数据表合并方法,所述数据表合并方法包括:
5.接收数据表合并请求;
6.根据所述数据表合并请求识别出多个待处理数据表,每个所述待处理数据表包括主键;
7.统计所述多个待处理数据表中每个所述合并字段的字段数量;
8.根据所述字段数量检测所述多个待处理数据表对所述合并字段的生成准确度;
9.根据所述生成准确度及所述合并字段从所述多个待处理数据表中采集业务数据;
10.基于所述合并字段从配置表中定位出输出表;
11.基于所述主键及多个所述合并字段的字段类型将所述业务数据并行写入至所述输出表中,得到目标数据表。
12.根据本发明优选实施例,所述根据所述数据表合并请求识别出多个待处理数据表包括:
13.解析所述数据表合并请求的报文,得到所述报文携带的数据信息;
14.从所述数据信息中提取数据库标识及键值维度;
15.将与所述数据库标识对应的数据库确定为目标数据库;
16.从所述目标数据库中筛选出与所述键值维度及预设状态均匹配的数据表作为所述多个待处理数据表。
17.根据本发明优选实施例,所述统计所述多个待处理数据表中每个所述合并字段的字段数量包括:
18.从每个所述待处理数据表中提取多个所述合并字段;
19.将每个所述合并字段写入预设查询指令中,得到每个所述合并字段的字段查询语句;
20.基于所述字段查询语句对所述多个待处理数据表进行查询,得到查询结果;
21.统计所述查询结果中数据表的数量,得到所述字段数量。
22.根据本发明优选实施例,所述根据所述字段数量检测所述多个待处理数据表对所述合并字段的生成准确度包括:
23.将所述字段数量大于或者等于预设数量的合并字段确定为重复字段;
24.基于所述重复字段从所述多个待处理数据表中筛选出多个待测数据表;
25.获取每个所述待测数据表的历史合并记录,并获取每个所述历史合并记录的合并准确度;
26.根据所述合并准确度计算每个所述待处理数据表对所述重复字段的生成准确度,包括:
[0027][0028]
其中,y是指所述生成准确度,x1、x2、

、xn分别是指所述合并准确度,k是指所述预设调整比例。
[0029]
根据本发明优选实施例,所述根据所述生成准确度及所述合并字段从所述多个待处理数据表中采集业务数据包括:
[0030]
将所述生成准确度最高的待测数据表确定为特征数据表;
[0031]
从所述特征数据表中采集与所述重复字段对应的数据作为所述业务数据;
[0032]
将小于所述预设数量的合并字段确定为单一字段;
[0033]
从包含有所述单一字段的待处理数据表中采集与所述单一字段对应的数据作为所述业务数据。
[0034]
根据本发明优选实施例,所述基于所述合并字段从配置表中定位出输出表包括:
[0035]
从所述配置表中获取每个所述合并字段的索引表;
[0036]
筛选出与全部合并字段对应的索引表作为初始表;
[0037]
若所述初始表有多个,则获取每个所述初始表的运行状态;
[0038]
将所述运行状态为配置状态的初始表确定为所述输出表。
[0039]
根据本发明优选实施例,所述基于所述主键及多个所述合并字段的字段类型将所述业务数据并行写入至所述输出表中,得到目标数据表包括:
[0040]
将每个所述合并字段所对应的业务数据与预设类型所对应的设定数据进行匹配,并将与该业务数据匹配成功的设定数据所对应的预设类型确定为所述字段类型;
[0041]
从预设线程池中获取与所述字段类型对应的执行线程;
[0042]
基于所述主键,通过所述执行线程将与所述字段类型对应的业务数据并行写入所述输出表中,得到所述目标数据表。
[0043]
另一方面,本发明还提出一种数据表合并装置,所述数据表合并装置包括:
[0044]
接收单元,用于接收数据表合并请求;
[0045]
识别单元,用于根据所述数据表合并请求识别出多个待处理数据表,每个所述待处理数据表包括主键;
[0046]
统计单元,用于统计所述多个待处理数据表中每个所述合并字段的字段数量;
[0047]
检测单元,用于根据所述字段数量检测所述多个待处理数据表对所述合并字段的生成准确度;
[0048]
采集单元,用于根据所述生成准确度及所述合并字段从所述多个待处理数据表中采集业务数据;
[0049]
定位单元,用于基于所述合并字段从配置表中定位出输出表;
[0050]
写入单元,用于基于所述主键及多个所述合并字段的字段类型将所述业务数据并行写入至所述输出表中,得到目标数据表。
[0051]
另一方面,本发明还提出一种电子设备,所述电子设备包括:
[0052]
存储器,存储计算机可读指令;及
[0053]
处理器,执行所述存储器中存储的计算机可读指令以实现所述数据表合并方法。
[0054]
另一方面,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被电子设备中的处理器执行以实现所述数据表合并方法。
[0055]
由以上技术方案可以看出,本发明通过统计每个合并字段在所述多个待处理数据表中的字段数量,能够准确的筛选出需要进行检测分析的合并字段,通过检测所述多个待处理数据表对该合并字段的生成准确度,有利于从所述多个待处理数据表中准确的采集到与所述合并字段对应的业务数据,提高了所述目标数据表的生成准确度。此外,基于所述合并字段能够从配置表中定位出所述输出表,进而根据所述字段类型并行将所述业务数据写入至所述输出表中,由于能够直接定位出所述输出表,而无需对所述多个待处理数据表进行拼接处理,因此,能够提高所述业务数据的合并效率,同时,由于本发明并行对所述业务数据进行写入,因此能够进一步提高数据表合并效率。
附图说明
[0056]
图1是本发明数据表合并方法的较佳实施例的流程图。
[0057]
图2是本发明数据表合并装置的较佳实施例的功能模块图。
[0058]
图3是本发明实现数据表合并方法的较佳实施例的电子设备的结构示意图。
具体实施方式
[0059]
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
[0060]
如图1所示,是本发明数据表合并方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
[0061]
所述数据表合并方法可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
[0062]
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
[0063]
所述数据表合并方法应用于一个或者多个电子设备中,所述电子设备是一种能够
按照事先设定或存储的计算机可读指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(application specific integrated circuit,asic)、可编程门阵列(field-programmable gate array,fpga)、数字信号处理器(digital signal processor,dsp)、嵌入式设备等。
[0064]
所述电子设备可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(personal digital assistant,pda)、游戏机、交互式网络电视(internet protocol television,iptv)、智能穿戴式设备等。
[0065]
所述电子设备可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络电子设备、多个网络电子设备组成的电子设备组或基于云计算(cloud computing)的由大量主机或网络电子设备构成的云。
[0066]
所述电子设备所处的网络包括,但不限于:互联网、广域网、城域网、局域网、虚拟专用网络(virtual private network,vpn)等。
[0067]
s10,接收数据表合并请求。
[0068]
在本发明的至少一个实施例中,所述数据表合并请求可以由任一业务人员触发生成。所述数据表合并请求中携带有用于指示所述数据库标识的标签、所述数据库标识、用于指示所述键值维度的标签及所述键值维度等。
[0069]
在本发明的至少一个实施例中,所述电子设备对所述数据表合并请求的触发用户进行权限认证,当所述触发用户通过权限认证,所述电子设备接收所述数据表合并请求。
[0070]
s11,根据所述数据表合并请求识别出多个待处理数据表,每个所述待处理数据表包括主键。
[0071]
在本发明的至少一个实施例中,所述多个待处理数据表是指需要进行合并的数据表。
[0072]
在本发明的至少一个实施例中,所述电子设备根据所述数据表合并请求识别出多个待处理数据表包括:
[0073]
解析所述数据表合并请求的报文,得到所述报文携带的数据信息;
[0074]
从所述数据信息中提取数据库标识及键值维度;
[0075]
将与所述数据库标识对应的数据库确定为目标数据库;
[0076]
从所述目标数据库中筛选出与所述键值维度及预设状态均匹配的数据表作为所述多个待处理数据表。
[0077]
其中,所述数据信息包括,但不限于:用于指示所述数据库标识的标签、所述数据库标识、用于指示所述键值维度的标签及所述键值维度等。
[0078]
所述键值维度是指所述主键所对应的维度,例如,所述键值维度可以是指所述主键所对应的键值的字符数量,例如,所述主键所对应的键值为abcdef,则所述键值维度为6。
[0079]
所述预设状态是指未进行数据合并的状态。
[0080]
通过解析所述报文,由于无需对整个请求进行解析,因此能够提高所述数据信息的解析效率,通过所述数据库标识能够准确的定位出所述目标数据库,进而通过所述键值维度及所述预设状态能够从所述目标数据库中筛选出需要进行数据表合并的多个待处理数据表。
[0081]
s12,统计所述多个待处理数据表中每个所述合并字段的字段数量。
[0082]
在本发明的至少一个实施例中,所述合并字段是指所述多个待处理数据表中所包含的字段,例如,所述合并字段可以是日期、业务销售量等。
[0083]
所述字段数量是指所述合并字段在所述多个待处理数据表中的数量,例如,合并字段a在待处理数据表001及待处理数据表002中出现,则所述合并字段a的字段数量为2。
[0084]
在本发明的至少一个实施例中,所述电子设备统计所述多个待处理数据表中每个所述合并字段的字段数量包括:
[0085]
从每个所述待处理数据表中提取多个所述合并字段;
[0086]
将每个所述合并字段写入预设查询指令中,得到每个所述合并字段的字段查询语句;
[0087]
基于所述字段查询语句对所述多个待处理数据表进行查询,得到查询结果;
[0088]
统计所述查询结果中数据表的数量,得到所述字段数量。
[0089]
其中,所述预设查询指令是指不包含查询对象的sql语句。
[0090]
每个所述字段查询语句中有且仅包含唯一的合并字段。
[0091]
所述查询结果为包含有相应查询字段的待处理数据表。
[0092]
通过所述预设查询指令能够快速生成所述字段查询语句,进而基于所述字段查询语句对所述多个待处理数据表进行查询,提高所述查询结果的生成效率,由于所述查询结果为包含有相应查询字段的待处理数据表,因此,通过统计所述查询结果的数量能够准确的确定出所述字段数量。
[0093]
s13,根据所述字段数量检测所述多个待处理数据表对所述合并字段的生成准确度。
[0094]
在本发明的至少一个实施例中,所述生成准确度是指所述多个待处理数据表对重复字段的生成准确度,其中,所述重复字段是指所述字段数量大于或者等于预设数量的合并字段。所述预设数量通常设定为2。相应的,所述重复字段是指所述字段数量大于2的合并字段,例如,所述合并字段a的字段数量为2,则所述合并字段a为所述重复字段。
[0095]
在本发明的至少一个实施例中,所述电子设备根据所述字段数量检测所述多个待处理数据表对所述合并字段的生成准确度包括:
[0096]
将所述字段数量大于或者等于预设数量的合并字段确定为重复字段;
[0097]
基于所述重复字段从所述多个待处理数据表中筛选出多个待测数据表;
[0098]
获取每个所述待测数据表的历史合并记录,并获取每个所述历史合并记录的合并准确度;
[0099]
根据所述合并准确度计算每个所述待处理数据表对所述重复字段的生成准确度,包括:
[0100][0101]
其中,y是指所述生成准确度,x1、x2、

、xn分别是指所述合并准确度,k是指所述预设调整比例。
[0102]
其中,所述待测数据表是指包含有所述重复字段的待处理数据表。
[0103]
所述历史合并记录是指所述待测数据表参与合并的记录。
[0104]
所述合并准确度可以是审核用户针对所述历史合并记录进行标识的数值。
[0105]
所述预设调整比例可以根据实际需求设定,本发明对此不再赘述。
[0106]
通过所述字段数量与所述预设数量的比较能够准确的从所述合并字段中筛选出重复字段,进而根据所述重复字段筛选出所述多个待测数据表,避免了对不包含所述重复字段的待处理数据表进行分析,提高了所述生成准确度的生成有效性,进一步,根据每个待测数据表的历史合并记录及相应的合并准确度能够准确的生成每个待处理数据表对所述重复字段的生成准确度,同时由于无需对所有合并字段进行分析,能够提高所述生成准确度的检测效率。
[0107]
s14,根据所述生成准确度及所述合并字段从所述多个待处理数据表中采集业务数据。
[0108]
在本发明的至少一个实施例中,所述业务数据包括所述重复字段在特征数据表中的数据信息,单一字段在对应的待处理数据表中的数据信息。其中,所述特征数据表是指所述生成准确度最高的待测数据表,所述单一字段是指小于所述预设数量的合并字段。
[0109]
在本发明的至少一个实施例中,所述电子设备根据所述生成准确度及所述合并字段从所述多个待处理数据表中采集业务数据包括:
[0110]
将所述生成准确度最高的待测数据表确定为特征数据表;
[0111]
从所述特征数据表中采集与所述重复字段对应的数据作为所述业务数据;
[0112]
将小于所述预设数量的合并字段确定为单一字段;
[0113]
从包含有所述单一字段的待处理数据表中采集与所述单一字段对应的数据作为所述业务数据。
[0114]
通过上述实施方式,能够基于所述重复字段及所述单一字段采取相应的采集方式对所述业务数据进行采集,提高了所述业务数据的采集全面性。
[0115]
s15,基于所述合并字段从配置表中定位出输出表。
[0116]
在本发明的至少一个实施例中,所述配置表中存储有多个字段与该字段的索引表的映射关系。
[0117]
所述输出表是指所述配置表中与全部合并字段对应的索引表。
[0118]
在本发明的至少一个实施例中,所述电子设备基于所述合并字段从配置表中定位出输出表包括:
[0119]
从所述配置表中获取每个所述合并字段的索引表;
[0120]
筛选出与全部合并字段对应的索引表作为初始表;
[0121]
若所述初始表有多个,则获取每个所述初始表的运行状态;
[0122]
将所述运行状态为配置状态的初始表确定为所述输出表。
[0123]
其中,所述初始表是指所述配置表中与全部合并字段对应的索引表,例如,合并字段b、合并字段c、合并字段d,若在所述配置表中,所述合并字段b、所述合并字段c、所述合并字段d均与索引表1、索引表2对应,则所述初始表为:所述索引表1及所述索引表2。
[0124]
所述配置状态是指处于空闲状态的初始表,也就是说,所述输出表是指当前时刻没有进行数据写入的初始表。
[0125]
通过所述配置表能够从所述索引表中快速的筛选出所述初始表,进而在所述初始表有多个时,通过多个所述初始表的运行状态选取所述输出表,由于所述输出表处于所述配置状态,因此无需在写入所述业务数据时无需等待其他数据写入,因此能够提高所述输
出表的数据写入效率。
[0126]
s16,基于所述主键及多个所述合并字段的字段类型将所述业务数据并行写入至所述输出表中,得到目标数据表。
[0127]
需要强调的是,为进一步保证上述目标数据表的私密和安全性,上述目标数据表还可以存储于一区块链的节点中。
[0128]
在本发明的至少一个实施例中,所述预设类型包括:数值型、字符型等。
[0129]
所述目标数据表是指对所述待处理数据表进行合并后所生成的数据表。
[0130]
在本发明的至少一个实施例中,所述电子设备基于所述主键及多个所述合并字段的字段类型将所述业务数据并行写入至所述输出表中,得到目标数据表包括:
[0131]
将每个所述合并字段所对应的业务数据与预设类型所对应的设定数据进行匹配,并将与该业务数据匹配成功的设定数据所对应的预设类型确定为所述字段类型;
[0132]
从预设线程池中获取与所述字段类型对应的执行线程;
[0133]
基于所述主键,通过所述执行线程将与所述字段类型对应的业务数据并行写入所述输出表中,得到所述目标数据表。
[0134]
其中,所述预设线程池中存储有多个闲置线程,每个闲置线程都有对应的处理类型。
[0135]
通过将每个合并字段所对应的业务数据与预设类型所对应的设定数据进行匹配,能够准确的确定出所述字段类型,进而基于所述字段类型能够从所述预设线程池中获取对应的执行线程,从而提高所述执行线程对所述业务数据的写入效率,此外,通过多个所述执行线程对所述业务数据进行并行写入,能够进一步提高所述业务数据的写入效率。
[0136]
由以上技术方案可以看出,本发明通过统计每个合并字段在所述多个待处理数据表中的字段数量,能够准确的筛选出需要进行检测分析的合并字段,通过检测所述多个待处理数据表对该合并字段的生成准确度,有利于从所述多个待处理数据表中准确的采集到与所述合并字段对应的业务数据,提高了所述目标数据表的生成准确度。此外,基于所述合并字段能够从配置表中定位出所述输出表,进而根据所述字段类型并行将所述业务数据写入至所述输出表中,由于能够直接定位出所述输出表,而无需对所述多个待处理数据表进行拼接处理,因此,能够提高所述业务数据的合并效率,同时,由于本发明并行对所述业务数据进行写入,因此能够进一步提高数据表合并效率。
[0137]
如图2所示,是本发明数据表合并装置的较佳实施例的功能模块图。所述数据表合并装置11包括接收单元110、识别单元111、统计单元112、检测单元113、采集单元114、定位单元115及写入单元116。本发明所称的模块/单元是指一种能够被处理器13所获取,并且能够完成固定功能的一系列计算机可读指令段,其存储在存储器12中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。
[0138]
接收单元110接收数据表合并请求。
[0139]
在本发明的至少一个实施例中,所述数据表合并请求可以由任一业务人员触发生成。所述数据表合并请求中携带有用于指示所述数据库标识的标签、所述数据库标识、用于指示所述键值维度的标签及所述键值维度等。
[0140]
在本发明的至少一个实施例中,所述接收单元110对所述数据表合并请求的触发用户进行权限认证,当所述触发用户通过权限认证,所述接收单元110接收所述数据表合并
请求。
[0141]
识别单元111根据所述数据表合并请求识别出多个待处理数据表,每个所述待处理数据表包括主键。
[0142]
在本发明的至少一个实施例中,所述多个待处理数据表是指需要进行合并的数据表。
[0143]
在本发明的至少一个实施例中,所述识别单元111根据所述数据表合并请求识别出多个待处理数据表包括:
[0144]
解析所述数据表合并请求的报文,得到所述报文携带的数据信息;
[0145]
从所述数据信息中提取数据库标识及键值维度;
[0146]
将与所述数据库标识对应的数据库确定为目标数据库;
[0147]
从所述目标数据库中筛选出与所述键值维度及预设状态均匹配的数据表作为所述多个待处理数据表。
[0148]
其中,所述数据信息包括,但不限于:用于指示所述数据库标识的标签、所述数据库标识、用于指示所述键值维度的标签及所述键值维度等。
[0149]
所述键值维度是指所述主键所对应的维度,例如,所述键值维度可以是指所述主键所对应的键值的字符数量,例如,所述主键所对应的键值为abcdef,则所述键值维度为6。
[0150]
所述预设状态是指未进行数据合并的状态。
[0151]
通过解析所述报文,由于无需对整个请求进行解析,因此能够提高所述数据信息的解析效率,通过所述数据库标识能够准确的定位出所述目标数据库,进而通过所述键值维度及所述预设状态能够从所述目标数据库中筛选出需要进行数据表合并的多个待处理数据表。
[0152]
统计单元112统计所述多个待处理数据表中每个所述合并字段的字段数量。
[0153]
在本发明的至少一个实施例中,所述合并字段是指所述多个待处理数据表中所包含的字段,例如,所述合并字段可以是日期、业务销售量等。
[0154]
所述字段数量是指所述合并字段在所述多个待处理数据表中的数量,例如,合并字段a在待处理数据表001及待处理数据表002中出现,则所述合并字段a的字段数量为2。
[0155]
在本发明的至少一个实施例中,所述统计单元112统计所述多个待处理数据表中每个所述合并字段的字段数量包括:
[0156]
从每个所述待处理数据表中提取多个所述合并字段;
[0157]
将每个所述合并字段写入预设查询指令中,得到每个所述合并字段的字段查询语句;
[0158]
基于所述字段查询语句对所述多个待处理数据表进行查询,得到查询结果;
[0159]
统计所述查询结果中数据表的数量,得到所述字段数量。
[0160]
其中,所述预设查询指令是指不包含查询对象的sql语句。
[0161]
每个所述字段查询语句中有且仅包含唯一的合并字段。
[0162]
所述查询结果为包含有相应查询字段的待处理数据表。
[0163]
通过所述预设查询指令能够快速生成所述字段查询语句,进而基于所述字段查询语句对所述多个待处理数据表进行查询,提高所述查询结果的生成效率,由于所述查询结果为包含有相应查询字段的待处理数据表,因此,通过统计所述查询结果的数量能够准确
的确定出所述字段数量。
[0164]
检测单元113根据所述字段数量检测所述多个待处理数据表对所述合并字段的生成准确度。
[0165]
在本发明的至少一个实施例中,所述生成准确度是指所述多个待处理数据表对重复字段的生成准确度,其中,所述重复字段是指所述字段数量大于或者等于预设数量的合并字段。所述预设数量通常设定为2。相应的,所述重复字段是指所述字段数量大于2的合并字段,例如,所述合并字段a的字段数量为2,则所述合并字段a为所述重复字段。
[0166]
在本发明的至少一个实施例中,所述检测单元113根据所述字段数量检测所述多个待处理数据表对所述合并字段的生成准确度包括:
[0167]
将所述字段数量大于或者等于预设数量的合并字段确定为重复字段;
[0168]
基于所述重复字段从所述多个待处理数据表中筛选出多个待测数据表;
[0169]
获取每个所述待测数据表的历史合并记录,并获取每个所述历史合并记录的合并准确度;
[0170]
根据所述合并准确度计算每个所述待处理数据表对所述重复字段的生成准确度,包括:
[0171][0172]
其中,y是指所述生成准确度,x1、x2、

、xn分别是指所述合并准确度,k是指所述预设调整比例。
[0173]
其中,所述待测数据表是指包含有所述重复字段的待处理数据表。
[0174]
所述历史合并记录是指所述待测数据表参与合并的记录。
[0175]
所述合并准确度可以是审核用户针对所述历史合并记录进行标识的数值。
[0176]
所述预设调整比例可以根据实际需求设定,本发明对此不再赘述。
[0177]
通过所述字段数量与所述预设数量的比较能够准确的从所述合并字段中筛选出重复字段,进而根据所述重复字段筛选出所述多个待测数据表,避免了对不包含所述重复字段的待处理数据表进行分析,提高了所述生成准确度的生成有效性,进一步,根据每个待测数据表的历史合并记录及相应的合并准确度能够准确的生成每个待处理数据表对所述重复字段的生成准确度,同时由于无需对所有合并字段进行分析,能够提高所述生成准确度的检测效率。
[0178]
采集单元114根据所述生成准确度及所述合并字段从所述多个待处理数据表中采集业务数据。
[0179]
在本发明的至少一个实施例中,所述业务数据包括所述重复字段在特征数据表中的数据信息,单一字段在对应的待处理数据表中的数据信息。其中,所述特征数据表是指所述生成准确度最高的待测数据表,所述单一字段是指小于所述预设数量的合并字段。
[0180]
在本发明的至少一个实施例中,所述采集单元114根据所述生成准确度及所述合并字段从所述多个待处理数据表中采集业务数据包括:
[0181]
将所述生成准确度最高的待测数据表确定为特征数据表;
[0182]
从所述特征数据表中采集与所述重复字段对应的数据作为所述业务数据;
[0183]
将小于所述预设数量的合并字段确定为单一字段;
[0184]
从包含有所述单一字段的待处理数据表中采集与所述单一字段对应的数据作为所述业务数据。
[0185]
通过上述实施方式,能够基于所述重复字段及所述单一字段采取相应的采集方式对所述业务数据进行采集,提高了所述业务数据的采集全面性。
[0186]
定位单元115基于所述合并字段从配置表中定位出输出表。
[0187]
在本发明的至少一个实施例中,所述配置表中存储有多个字段与该字段的索引表的映射关系。
[0188]
所述输出表是指所述配置表中与全部合并字段对应的索引表。
[0189]
在本发明的至少一个实施例中,所述定位单元115基于所述合并字段从配置表中定位出输出表包括:
[0190]
从所述配置表中获取每个所述合并字段的索引表;
[0191]
筛选出与全部合并字段对应的索引表作为初始表;
[0192]
若所述初始表有多个,则获取每个所述初始表的运行状态;
[0193]
将所述运行状态为配置状态的初始表确定为所述输出表。
[0194]
其中,所述初始表是指所述配置表中与全部合并字段对应的索引表,例如,合并字段b、合并字段c、合并字段d,若在所述配置表中,所述合并字段b、所述合并字段c、所述合并字段d均与索引表1、索引表2对应,则所述初始表为:所述索引表1及所述索引表2。
[0195]
所述配置状态是指处于空闲状态的初始表,也就是说,所述输出表是指当前时刻没有进行数据写入的初始表。
[0196]
通过所述配置表能够从所述索引表中快速的筛选出所述初始表,进而在所述初始表有多个时,通过多个所述初始表的运行状态选取所述输出表,由于所述输出表处于所述配置状态,因此无需在写入所述业务数据时无需等待其他数据写入,因此能够提高所述输出表的数据写入效率。
[0197]
写入单元116基于所述主键及多个所述合并字段的字段类型将所述业务数据并行写入至所述输出表中,得到目标数据表。
[0198]
需要强调的是,为进一步保证上述目标数据表的私密和安全性,上述目标数据表还可以存储于一区块链的节点中。
[0199]
在本发明的至少一个实施例中,所述预设类型包括:数值型、字符型等。
[0200]
所述目标数据表是指对所述待处理数据表进行合并后所生成的数据表。
[0201]
在本发明的至少一个实施例中,所述写入单元116基于所述主键及多个所述合并字段的字段类型将所述业务数据并行写入至所述输出表中,得到目标数据表包括:
[0202]
将每个所述合并字段所对应的业务数据与预设类型所对应的设定数据进行匹配,并将与该业务数据匹配成功的设定数据所对应的预设类型确定为所述字段类型;
[0203]
从预设线程池中获取与所述字段类型对应的执行线程;
[0204]
基于所述主键,通过所述执行线程将与所述字段类型对应的业务数据并行写入所述输出表中,得到所述目标数据表。
[0205]
其中,所述预设线程池中存储有多个闲置线程,每个所述闲置线程都有对应的处理类型。
[0206]
通过将每个合并字段所对应的业务数据与预设类型所对应的设定数据进行匹配,
media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他存储器件。
[0214]
所述存储器12可以是电子设备1的外部存储器和/或内部存储器。进一步地,所述存储器12可以是具有实物形式的存储器,如内存条、tf卡(trans-flash card)等等。
[0215]
所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机可读指令来指令相关的硬件来完成,所述的计算机可读指令可存储于一计算机可读存储介质中,该计算机可读指令在被处理器执行时,可实现上述各个方法实施例的步骤。
[0216]
其中,所述计算机可读指令包括计算机可读指令代码,所述计算机可读指令代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机可读指令代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)。
[0217]
本发明所指区块链是分布式数据表合并、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
[0218]
结合图1,所述电子设备1中的所述存储器12存储计算机可读指令实现一种数据表合并方法,所述处理器13可执行所述计算机可读指令从而实现:
[0219]
接收数据表合并请求;
[0220]
根据所述数据表合并请求识别出多个待处理数据表,每个所述待处理数据表包括主键;
[0221]
统计所述多个待处理数据表中每个所述合并字段的字段数量;
[0222]
根据所述字段数量检测所述多个待处理数据表对所述合并字段的生成准确度;
[0223]
根据所述生成准确度及所述合并字段从所述多个待处理数据表中采集业务数据;
[0224]
基于所述合并字段从配置表中定位出输出表;
[0225]
基于所述主键及多个所述合并字段的字段类型将所述业务数据并行写入至所述输出表中,得到目标数据表。
[0226]
具体地,所述处理器13对上述计算机可读指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
[0227]
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0228]
所述计算机可读存储介质上存储有计算机可读指令,其中,所述计算机可读指令被处理器13执行时用以实现以下步骤:
[0229]
接收数据表合并请求;
[0230]
根据所述数据表合并请求识别出多个待处理数据表,每个所述待处理数据表包括
主键;
[0231]
统计所述多个待处理数据表中每个所述合并字段的字段数量;
[0232]
根据所述字段数量检测所述多个待处理数据表对所述合并字段的生成准确度;
[0233]
根据所述生成准确度及所述合并字段从所述多个待处理数据表中采集业务数据;
[0234]
基于所述合并字段从配置表中定位出输出表;
[0235]
基于所述主键及多个所述合并字段的字段类型将所述业务数据并行写入至所述输出表中,得到目标数据表。
[0236]
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0237]
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
[0238]
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
[0239]
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。所述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
[0240]
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献