一种基于嵌入式操作系统的故障恢复方法与流程
- 国知局
- 2025-01-10 13:48:33
本发明涉及一种基于嵌入式操作系统的故障恢复方法,属于操作系统故障处理。
背景技术:
1、计算机系统已经被广泛应用于航天等安全攸关领域,这类系统一旦发生错误将会造成严重后果,建立高可信的计算机系统在安全攸关领域是极其重要的。操作系统作为计算机系统中最基础的底层软件,是构建高可信度计算机系统的关键。
2、在实现过程中存在着如下应用问题需要解决:(1)针对嵌入式操作系统的检查点主要使用状态文件进行记录,对其进行检索的系统开销大,效率不高;(2)针对嵌入式操作系统的故障恢复,主要使用对所有进程直接回滚的方法,系统开销比较大。
技术实现思路
1、本发明解决的技术问题是:克服现有技术的不足,提出了一种基于嵌入式操作系统的故障恢复方法,通过使用检查点文件结构及仅回卷对存储修改状态进行置位标记的进程的方法,实现嵌入式操作系统故障恢复,解决了现有技术进行故障恢复时,需要回卷所有进程造成的效率低、开销大等问题。
2、本发明的技术解决方案是:
3、一种基于嵌入式操作系统的故障恢复方法,包括:
4、步骤1,根据嵌入式操作系统之上运行的多个进程,构建包含任务信息和存储信息的目标进程结构;
5、步骤2,使用检查点文件对关于检查点的各文件进行索引和存储;其中,检查点文件保存恢复进程运行所需的所有信息;
6、检查点文件由文件起始数据、结束标志以及若干个进程数据组成;文件起始数据包括文件起始的头标志、程序版本、内核版本、进程数量、进程信息存储结构;
7、进程数据包括进程id、存储修改标志、关联进程存储修改标志、进程关系结构、进程文件系统信息、进程回写文件和进程其他数据;
8、结束标志表示检查点文件的结束;
9、步骤3,按照设定的时间间隔设置多任务协同检查点,保存检查点时间间隔;
10、步骤4,系统运行过程中,按照检查点时间间隔,更新检查点文件中数据;
11、步骤5,当系统收到检查点设置请求时,按检查点文件中的进程关系结构,进行全局一致性的检查点设置,对进程数据的存储修改标志、关联进程存储修改标志进行设置;
12、步骤6,当系统收到检查点恢复命令时,根据检查点文件中的进程关系结构、检查点文件记录的当前进程存储修改标志、关联进程存储修改标志,对相应进程进行回卷,恢复各进程的所有数据,恢复各进程。
13、进一步地,当系统收到检查点设置请求时,按进程关系结构,进行全局一致性的检查点设置,具体方法为:
14、收到检查点设置之后,等待用户中断保存请求;回调工作进程按进程关系结构发中断保存信号,检查点设置的目标进程收到中断保存信号;
15、更新保存目标进程的进程关系结构,保存所有进程数据,设置本进程检查点结束标志;
16、若全局一致性检查点设置没有完成,则按进程关系结构进行其它进程检查点设置,否则全局一致性检查点处理结束。
17、进一步地,当系统收到检查点恢复命令时,对在系统运行的进程进行恢复的方法为:
18、确定下一个需要恢复的进程之后,根据进程关系结构阻塞对应的进程;
19、唤醒主进程,按照进程结构检查相关进程存储修改状态:若进程数据的存储修改标志表示进程自身进行了存储修改,则对该进程进行回卷;若关联进程存储修改标志表示相关进程进行了存储修改,则对相关进程进行回卷;
20、恢复进程的所有数据,恢复进程;
21、按照存储的进程关系查找和存储修改进程存在依赖关系的下一个进程,直到所有进程恢复完毕。
22、进一步地,系统运行过程中,对检查点文件中的数据进行更新的方法为:
23、记录检查点文件的文件起始数据。记录程序版本,记录内核版本,记录进程数量,把每个进程在文件中的对应位置记录在进程信息存储结构中。
24、记录所有的进程数据。对每个进程按照进程信息存储结构的顺序记录对应的进程id,若运行过程进行了读写操作则将本进程存储修改标志置位否则清零,若相关联的进程进行了读写则将关联进程存储修改标志置位否则清零。
25、进一步地,检查点时间间隔为:
26、
27、式中,tchek为系统进行检查点设置的间隔时间,tbds是系统发生故障的平均间隔时间,tsp是运行检查点操作消耗的时间;参数σ取值范围是0<σ≤100。
28、进一步地,存储修改标志记录进程是否进行内存、寄存器存储修改;关联进程存储修改标志记录与进程相关的其他进程是否进行了存储修改。
29、进一步地,目标进程结构记录进程的关系信息,包括进程之间创建、进程间层次关系信息。
30、进一步地,文件起始数据中进程信息存储结构记录所有进程id对应在检查点文件的位置。
31、本发明与现有技术相比的优点在于:
32、(1)本发明采用的检查点文件,文件头采用了进程信息存储结构记录了所有进程在检查点文件中的位置,便于对检查点文件进行搜索,具有创造性。
33、(2)本发明采用的检查点文件对进程间的约束依赖关系进行描述,采用本进程存储修改标志表示进程自身进行了存储修改,关联进程存储修改状态字记录相关进程的存储修改状态。
34、(3)本发明采用仅回卷对存储修改状态进行置位标记的进程的方法,结合使用进程关系信息文件确保所有和存储修改进程具有依赖关系的进程都进行了回卷,保障了故障恢复正确执行。
技术特征:1.一种基于嵌入式操作系统的故障恢复方法,其特征在于,包括:
2.根据权利要求1所述的一种基于嵌入式操作系统的故障恢复方法,其特征在于,当系统收到检查点设置请求时,按进程关系结构,进行全局一致性的检查点设置,具体方法为:
3.根据权利要求1所述的一种基于嵌入式操作系统的故障恢复方法,其特征在于,当系统收到检查点恢复命令时,对在系统运行的进程进行恢复的方法为:
4.根据权利要求1所述的一种基于嵌入式操作系统的故障恢复方法,其特征在于,系统运行过程中,对检查点文件中的数据进行更新的方法为:
5.根据权利要求1所述的一种基于嵌入式操作系统的故障恢复方法,其特征在于,检查点时间间隔为:
6.根据权利要求1所述的一种基于嵌入式操作系统的故障恢复方法,其特征在于,存储修改标志记录进程是否进行内存、寄存器存储修改;关联进程存储修改标志记录与进程相关的其他进程是否进行了存储修改。
7.根据权利要求1所述的一种基于嵌入式操作系统的故障恢复方法,其特征在于,目标进程结构记录进程的关系信息,包括进程之间创建、进程间层次关系信息。
8.根据权利要求1所述的一种基于嵌入式操作系统的故障恢复方法,其特征在于,文件起始数据中进程信息存储结构记录所有进程id对应在检查点文件的位置。
技术总结本发明公开了一种基于嵌入式操作系统的故障恢复方法,首先构建包含任务信息和存储信息的目标进程结构,再使用检查点文件对关于检查点的各文件进行索引和存储。按照设定的检查点时间间隔,更新检查点文件中数据。当系统收到检查点设置请求时,按检查点文件中的进程关系结构,进行全局一致性的检查点设置;当系统收到检查点恢复命令时,根据关系结构、当前进程存储修改标志、关联进程存储修改标志,对相应进程进行回卷,恢复各进程。本发明通过使用检查点文件结构及采用仅回卷对存储修改状态进行置位标记的进程的方法,确保所有和存储修改进程具有依赖关系的进程都进行回卷,保障了故障恢复正确执行。技术研发人员:苗蕾,乔磊,刘波,徐建,王华伟,谭彦亮,杨建宇,张锦坤,尚智,刘洪标,曹梦丹,张潇锐,许娜,刘晨璐,苗志富,韩朝君受保护的技术使用者:北京控制工程研究所技术研发日:技术公布日:2025/1/6本文地址:https://www.jishuxx.com/zhuanli/20250110/355369.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。