一种模拟投票的自动灾备切换方法与流程
- 国知局
- 2024-11-19 09:45:03
本发明涉及服务端,更具体的说,它涉及一种模拟投票的自动灾备切换方法。
背景技术:
1、在系统灾备体系设计时,需要考虑rto指标(recovery time objective,恢复时间目标),以达到生产环境停止服务时间尽可能短的目的。在实际的应用过程中,数据库稳定性是生产环境持续提供服务的主要考虑因素。当出现生产数据库损毁的场景时,需要手工将生产环境的应用路由切换至灾备环境。在灾备体系中,这种手工切换会在短时间内造成一定的业务影响。
技术实现思路
1、本发明克服了现有技术的不足,提供一种模拟投票的自动灾备切换方法。
2、本发明的技术方案如下:
3、一种基于代理模拟app投票的自动灾备切换方法,具体包括如下步骤:
4、101)部署代理结点步骤:在全国各地布署多个代理结点,并在每个结点部署多个模拟app,进行投票调试;
5、102)预处理步骤:模拟app的代理程序启动,将从每个结点获取各集群投票信息;
6、103)投票步骤:模拟app投票时,通过调用check_health接口,以实际服务器模拟业务进行读写操作;当有错误发生时,模拟app除了投票外,还会上传错误的结果,以供分析原因;
7、其中,每个结点先收集取得所有集群的配置,再按集群进行循环,依次检查每一个集群,每个集群的多个地址,按当前次数求余后取得一个地址进行访问;检查结果上报给收集结点,如果集群检查都好的,按整体一次约定的时间适当等待;
8、104)切换步骤:根据投票结果,如果有集群的投票中有坏结果且超出阈值,灾备的切换程序自动进行流量切换。
9、进一步的,全国布有至少8个服务器点, 以分布在广州、上海、北京的公有云服务上为主。
10、进一步的,步骤102)中读取到集群配置信息后,开始检查,在每间隔一定时间内完成一次所有集群的检查,每个集群按设定的顺序依次调用check_health接口。
11、进一步的,每间隔一定时间为15秒以内。
12、进一步的,模拟app的投票结果存在收集结点的数据库中,切换程序定期检查投票结果,如果有集群超过70%的代理报告错误,则认为此集群已经出现问题,需要切换后端服务到对端的灾备集群。
13、进一步的,切换程序包括误切换功能,当报代理少于3个,只报警不切换;期望代理数是n个,且n大于5,当实际上报数不足时,则认定网络不好,发出人工灾备切换建议。
14、进一步的,定期检查以每5秒一次。
15、进一步的,还包括105)恢复步骤:在灾备的切换程序切换动作发生后,设置切换标志并通知相关人员,在低峰时手工切回。
16、本发明相比现有技术优点在于:本发明模拟用户实际网络情况,多个代理保证投票的可靠性。切换速度远胜于人工,尽可能的减少用户停服时间。收集程序和切换程序独立,不会互相干扰,提高系统可靠性。代理结点上传错误原因有助于快速分析集群故障原因。
技术特征:1.一种模拟投票的自动灾备切换方法,其特征在于:具体包括如下步骤:
2. 根据权利要求1所述的一种模拟投票的自动灾备切换方法,其特征在于:全国布有至少8个服务器点, 以分布在广州、上海、北京的公有云服务上为主。
3.根据权利要求1所述的一种模拟投票的自动灾备切换方法,其特征在于:每间隔一定时间为15秒以内。
4.根据权利要求1所述的一种模拟投票的自动灾备切换方法,其特征在于:定期检查以每5秒一次。
技术总结本发明公开了一种模拟投票的自动灾备切换方法,具体包括如下步骤:101)部署代理结点步骤、102)预处理步骤、103)投票步骤、104)切换步骤、105)恢复步骤;本发明提供能自动灾备切换、上传错误原因有助于快速分析集群故障原因的一种模拟投票的自动灾备切换方法。技术研发人员:金新华,汤露兵,李正磊,徐克强受保护的技术使用者:杭州衣科信息技术股份有限公司技术研发日:技术公布日:2024/11/14本文地址:https://www.jishuxx.com/zhuanli/20241118/330058.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表