一种机房运维数据管理方法及系统与流程
- 国知局
- 2024-08-02 14:30:47
本发明涉及数据处理,具体涉及一种机房运维数据管理方法及系统。
背景技术:
1、随着信息技术的发展,机房作为信息化建设的核心基础设施应用越来越广泛,机房的运维数据的规模日益庞大;运维数据不仅包括了服务器、网络设备、存储设备等硬件设施的运行状态、性能参数和故障日志等信息,还涵盖了各种软件应用、业务系统的运行数据和交易记录等。运维数据的分析对于机房的运行管理至关重要,能够帮助运维人员及时发现潜在问题,优化资源配置等。
2、由于机房的运维数据的海量性以及多样性需要进行压缩存储和传输,现有的lzw串表压缩算法是一种无损压缩算法,能够对机房的运维数据进行压缩传输,lzw算法通过建立一个字典,用较短的代码表示较长的字符串实现压缩;但随着字典的构建,字典中会存在大量字符未进行重复使用,导致字典爆炸,同时字典中高频使用的字典字符的编码可能过大,导致压缩过程中占用空间的空间较大,机房的运维数据的压缩传输的效率较低。
技术实现思路
1、为了解决上述通过lzw算法对运维数据压缩传输的效率较低的技术问题,本发明的目的在于提供一种机房运维数据管理方法及系统,所采用的技术方案具体如下:
2、获取监测机房的运维数据序列;
3、根据所述运维数据序列中字符出现的频率特征获得目标字符;根据所述目标字符的邻域字符的种类特征获得lzw算法的初始字典;
4、根据所述初始字典通过lzw算法对所述运维数据序列进行字典更新,获得更新字典和字典字符频数;根据所述字典字符频数对所述更新字典中的字典字符进行迭代排序,获得迭代字典;根据所述迭代字典对所述运维数据序列进行编码获得编码序列和下一轮的迭代字典;根据下一轮的迭代字典对所述运维数据序列中未编码的片段继续进行编码和字典更新;当所述迭代字典超过预设容量时,根据所述字典字符频数对所述迭代字典中的字典字符进行删除更新;循环编码和字典更新的过程,直至运维数据序列编码完成,获得最终编码序列;
5、对所述最终编码序列进行传输;将传输后的最终编码序列根据迭代字典和字典字符频数进行解码。
6、进一步地,所述根据所述运维数据序列中字符出现的频率特征获得目标字符的步骤包括:
7、将运维数据序列中出现频率最高的种类字符作为目标字符。
8、进一步地,所述根据所述目标字符的邻域字符的种类特征获得lzw算法的初始字典的步骤包括:
9、在所述运维数据序列中以所述目标字符作为预设窗口的起始位置,将所述预设窗口中的字符片段作为字符段;当任意类型的字符段的数量超过预设数值时,将任意类型的字符段作为基础字符块;将所述基础字符块的预设窗口的长度增加一位,获得预设第二窗口;当预设第二窗口中的任意类型的字符段超过预设数值时,将任意类型的字符段作为新的基础字符块;继续将新的基础字符块的预设第二窗口的长度增加一位,获得预设第三窗口,判断预设第三窗口中任意类型的字符段的数量是否超过预设数值,直至任意类型的字符段的数量不超过预设数值,获得不同的基础字符块;若任意基础字符块为其他基础字符块的子集,将为子集的任意基础字符块进行删除,根据删除后剩余的基础字符块构建lzw算法的初始字典。
10、进一步地,所述根据所述初始字典通过lzw算法对所述运维数据序列进行字典更新,获得更新字典和字典字符频数的步骤包括:
11、根据lzw算法从所述运维数据序列中的第一位字符开始与初始字典中的字典字符进行匹配,直至出现字符不匹配,将不匹配的字符段添加至初始字典中获得所述更新字典;所述初始字典中每个字典字符的字典字符频数为常数0,将本轮获得的更新字典中能够参与编码的字符字典的字典字符频数增加1。
12、进一步地,所述根据所述字典字符频数对所述更新字典中的字典字符进行迭代排序,获得迭代字典的步骤包括:
13、根据更新字典中字典字符频数从大至小的顺序对字典字符进行排序,对于排序过程中字典字符频数相同且数量不低于两位的字典字符使用最优二叉树编码算法进行编码,获得树形编码值;根据所述树形编码值从小至大将字典字符频数相同的字典字符进行排序,获得更新字典对应的迭代字典,所述迭代字典中的编码值按照从小至大的顺序排序。
14、进一步地,所述当所述迭代字典超过预设容量时,根据所述字典字符频数对所述迭代字典中的字典字符进行删除更新的步骤包括:
15、当迭代字典中的字典字符的数量超过预设容量时,将迭代字典中任意一个字典字符频数为常数0的字典字符删除,若不存在字典字符频数为常数0的字典字符,则对迭代字典进行扩容。
16、进一步地,所述循环编码和字典更新的过程,直至运维数据序列编码完成,获得最终编码序列的步骤包括:
17、按照所述运维数据序列的字符顺序根据每轮编码的迭代字典进行循环编码和字典更新,不断增加编码序列的长度,直至运维数据序列编码完成,获得所述最终编码序列。
18、进一步地,所述将传输后的最终编码序列根据迭代字典和字典字符频数进行解码的步骤包括:
19、从所述最终编码序列的最后一位和对应的迭代字典开始进行解码,本轮解码完成后将解码的字典字符对应的字典字符频数减去常数1,按照变化后的字典字符频数从大至小对本轮解码的迭代字典中的字典字符进行排序;对于排序过程中字典字符频数相同的字典字符使用最优二叉树编码算法进行编码,将获得的所述树形编码值从小至大对字典字符频数相同的字典字符进行排序,获得下一轮解码的迭代字典;每一轮解码完成后更新一次迭代字典,直至最终编码序列解码完成。
20、本发明还提出了一种机房运维数据管理系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序实现任意一项一种机房运维数据管理方法的步骤。
21、本发明具有如下有益效果:
22、在本发明实施例中,获取目标字符能够确定运维数据序列中出现频率最大的字符,从而构建更符合运维数据序列的初始字典;根据初始字典对运维数据序列进行压缩,能够减少字典的冗余度,缩短编码过程中的编码序列长度,初步提高压缩传输效率。获得字典字符频数能够确定更新字典中字典字符中被编码的次数,从而根据字典字符频数获得迭代字典,根据迭代字典对运维数据序列进行编码,能够减少编码序列的长度,进一步提高压缩效率。根据字典字符频数对迭代字典中的字典字符进行删除能够减少字典的冗余度,减少存储压力。获取的最终编码序列能够提高运维数据序列的压缩传输效率。
技术特征:1.一种机房运维数据管理方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的一种机房运维数据管理方法,其特征在于,所述根据所述运维数据序列中字符出现的频率特征获得目标字符的步骤包括:
3.根据权利要求1所述的一种机房运维数据管理方法,其特征在于,所述根据所述目标字符的邻域字符的种类特征获得lzw算法的初始字典的步骤包括:
4.根据权利要求1所述的一种机房运维数据管理方法,其特征在于,所述根据所述初始字典通过lzw算法对所述运维数据序列进行字典更新,获得更新字典和字典字符频数的步骤包括:
5.根据权利要求1所述的一种机房运维数据管理方法,其特征在于,所述根据所述字典字符频数对所述更新字典中的字典字符进行迭代排序,获得迭代字典的步骤包括:
6.根据权利要求1所述的一种机房运维数据管理方法,其特征在于,所述当所述迭代字典超过预设容量时,根据所述字典字符频数对所述迭代字典中的字典字符进行删除更新的步骤包括:
7.根据权利要求1所述的一种机房运维数据管理方法,其特征在于,所述循环编码和字典更新的过程,直至运维数据序列编码完成,获得最终编码序列的步骤包括:
8.根据权利要求5所述的一种机房运维数据管理方法,其特征在于,所述将传输后的最终编码序列根据迭代字典和字典字符频数进行解码的步骤包括:
9.一种机房运维数据管理系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序实现如权利要求1-8任意一项所述方法的步骤。
技术总结本发明涉及数据处理技术领域,具体涉及一种机房运维数据管理方法及系统;根据运维数据序列中的目标字符的邻域字符的种类特征获得初始字典;根据初始字典通过LZW算法对运维数据序列进行字典更新,获得更新字典和字典字符频数;根据字典字符频数对更新字典进行迭代排序,获得迭代字典;根据迭代字典对运维数据序列进行编码获得编码序列和下一轮的迭代字典。根据字典字符频数对迭代字典中的字典字符进行删除更新,循环编码和字典更新的过程获得最终编码序列。本发明对最终编码序列进行传输,将传输后的最终编码序列根据迭代字典和字典字符频数进行解码,提高了运维数据序列的压缩传输效率。技术研发人员:马震,曹晓宁受保护的技术使用者:辽宁吉左网络科技有限公司技术研发日:技术公布日:2024/7/25本文地址:https://www.jishuxx.com/zhuanli/20240801/243003.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表