一种基于KubeEdge的卫星集群自治方法及星地协同计算系统与流程
- 国知局
- 2024-08-08 17:04:59
本发明涉及天基系统边缘计算场景,尤其涉及一种基于kubeedge的卫星集群自治方法及星地协同计算系统。
背景技术:
1、云计算中心可以为不同应用提供通用化的强大算力资源,在卫星数据处理中已被广泛使用。但是,由于云计算中心对算力、能源等需求较高,导致云计算中心很难在卫星上进行部署,因此,卫星上产生的数据通常需要传回地面云计算中心进行处理。
2、为了解决云计算中心离数据较远、计算延迟大等问题,目前提出了一种边缘计算技术,边缘计算技术通过将计算资源部署在离数据产生最近的地方,从而为应用提供低延迟的计算服务,同时也可降低与云计算中心交互的数据量。而随着边缘计算技术的发展,利用边缘计算技术在卫星上构建天基边缘计算平台,为卫星上应用提供低延迟的计算服务已成为目前航天发展的重要趋势之一。目前关于边缘计算平台的研究有很多,如paradrop、cloudlet、pcloud、openyurt以及开源的云原生边缘计算平台kubeedge等等。
3、以kubeedge为例,kubeedge就是将kubernetes原生的容器编排和调度能力拓展到边缘,并为边缘应用部署、云与边缘间的元数据同步、边缘设备管理等提供基础架构支持,目前已广泛应用于智能交通、智慧园区、智慧能源、智慧工厂、智慧银行、智慧工地、cdn等行业,为用户提供了一体化的边端云协同解决方案。
4、然而,现有的天基系统及网络发展长期以来严重滞后于地面,功能单一、信息孤立、资源分散、响应缓慢等影响多样化、智能化作战应用的问题仍然突出。天基系统普遍采用地面为主的管控、运维以及信息处理方式,系统的运行严重依赖地面。受境内布站限制,卫星等天基系统可见弧段不足,必然存在运行控制间断、管控不及时等问题,无法适应日益全球化、全天时的服务需求。而以地面为主的信息综合处理方式,则会导致响应速度慢、安全性差等问题,难以提供安全可靠、快速实时的天基资源服务。在天基网络环境下,卫星之间进行网络连接不同于地面计算设备,因此需要一种在卫星长时间离线的场景下实现星上自治的方法。
技术实现思路
1、本发明的目的在于针对现有技术的不足,提供一种基于kubeedge的卫星集群自治方法及星地协同计算系统。本发明能够满足卫星在长时间脱离地面站管控下的自主运行和管理需求,实现卫星与地面站之间的离线自治功能,同时在卫星与地面站重新建立通信联系后,能够快速准确地达成星地两端数据的一致更新和整合,充分满足系统整体的稳定性和可靠性要求。
2、本发明的目的是通过以下技术方案来实现的:本发明实施例第一方面提供了一种基于kubeedge的卫星集群自治方法,包括以下步骤:
3、(1)根据不同卫星组网规则,将天基系统的星载算力单元划分为多个相互区分的多元化目标联盟节点,并在目标联盟节点之间构建多元化的卫星自治联盟;
4、(2)在卫星自治联盟内部实施星载算力单元数据共享机制,该数据共享机制包括分布式数据库系统和分布式存储系统;
5、(3)在每个卫星自治联盟内的每个星载算力单元上均部署一套用于实时监测星载算力单元上的全部星载应用状态的应用管理组件,当监测到任一星载应用发生异常时,应用管理组件从分布式数据库系统中检索出该异常星载应用的所有元数据信息,根据异常星载应用的元数据信息采取对应的服务自治策略,以重新启动异常星载应用。
6、进一步地,每个所述卫星自治联盟中包含至少一个星载算力单元。
7、进一步地,所述根据不同卫星组网规则,将天基系统的星载算力单元划分为多个相互区分的多元化目标联盟节点,并在目标联盟节点之间构建多元化的卫星自治联盟,具体包括:
8、利用kubernetes按照不同的卫星组网规则,将天基系统的星载算力单元划分为多个具体不同用途或资源互补的目标联盟节点,并在目标联盟节点之间构建多元化的基于分布式共识和自组织机制的卫星自治联盟,并通过kubernetes的api服务器进行统一管理。
9、进一步地,所述步骤(2)包括以下子步骤:
10、(2.1)在卫星自治联盟中,部署一套用于存储各个星载算力单元及其上运行的星载应用的元数据信息的分布式数据库系统,通过部署和维护分布式数据库系统,对星载算力单元上运行的星载应用的元数据信息进行管理;
11、(2.2)在卫星自治联盟中,配置一套用于承载星载算力单元上运行的星载应用的业务数据、临时数据和日志数据的分布式存储系统,通过分布式存储系统在目标联盟节点之间分散存储和同步星载算力单元上运行的星载应用的业务数据、临时数据和日志数据。
12、进一步地,所述服务自治策略包括本地重启策略和迁移重启策略。
13、进一步地,所述应用管理组件具有如下功能:
14、实时监控目标联盟节点上运行的pod应用的状态,具体包括pod应用的运行状态、资源占用情况、网络连接状态以及容器内服务的健康状况;
15、当应用管理组件检测到运行在当前目标联盟节点上的任意pod应用处于异常状态时,从分布式数据库系统中检索获取与该异常pod应用关联的异常星载应用的所有元数据信息;
16、根据预设的服务自治策略,应用管理组件对异常pod应用状态进行解析分类,并据此分类结果执行对应的服务自治策略;
17、在执行迁移重启策略时,应用管理组件根据卫星自治联盟中所有星载算力单元的资源状况和星载应用的元数据信息,从卫星自治联盟内的多个目标联盟节点中选择与异常星载应用相适配的最优备用星载算力单元作为新的目标星载算力单元,以将异常pod应用关联的异常星载应用迁移到该新的目标星载算力单元上,并重新启动该星载应用;
18、整个过程中的监控、判断、决策以及执行操作均由应用管理组件自主完成,以实现天基系统星载算力单元在卫星自治联盟内的自治管理和故障恢复。
19、进一步地,所述根据卫星自治联盟中所有星载算力单元的资源状况和星载应用的元数据信息,从卫星自治联盟内的多个目标联盟节点中选择与异常星载应用相适配的最优备用星载算力单元作为新的目标星载算力单元,具体包括:
20、首先根据卫星自治联盟中所有星载算力单元的资源状况和星载应用的元数据信息,对卫星自治联盟内的多个目标联盟节点进行过滤,除去不符合预设优选节点要求条件的目标联盟节点;然后采用预设的打分策略对剩余符合优选节点要求条件的目标联盟节点进行打分,选取分数最高的目标联盟节点对应的星载算力单元作为与异常星载应用相适配的最优备用星载算力单元,将其作为新的目标星载算力单元。
21、进一步地,在所述步骤(3)之后,还包括:
22、利用kubernetes的kubelet组件实时获取目标联盟节点上的星载应用的状态信息,并在确认目标星载算力单元与地面控制系统通信链路正常的前提下通过kubeedge的边云通信框架及时将迁移重启后的星载应用的最新状态信息同步至地面控制系统,由kubeedge更新地面控制系统的分布式数据库,同时应用管理组件将星载应用的最新状态信息更新到分布式数据库中。
23、本发明实施例第二方面提供了一种用于实现上述的基于kubeedge的卫星集群自治方法的星地协同计算系统,包括:
24、云端核心模块;
25、边缘核心模块,与所述云端核心模块相互通信;
26、地面控制系统,基于kubernetes构建,所述地面控制系统用于实现对云端核心模块和边缘核心模块的控制;和
27、卫星自治中心,部署于边缘核心模块,所述卫星自治中心用于实时监测星载算力单元上星载应用的状态,响应于异常星载应用,并基于异常星载应用的异常原因,执行对应的服务自治策略;所述卫星自治中心由多个星载算力单元组成的卫星自治联盟、分布式数据库系统和分布式存储系统组成;
28、其中,所述卫星自治联盟具体为:基于不同卫星组网规则对天基系统的星载算力单元进行划分而构建的多个不同用途的卫星自治联盟;
29、所述分布式数据库系统部署于所述卫星自治联盟,所述分布式数据库系统用于存储卫星自治联盟中各个星载算力单元上运行的星载应用的元数据;
30、所述分布式存储系统部署于所述卫星自治联盟,所述分布式存储系统用于存储卫星自治联盟中各个星载算力单元上运行的星载应用的业务数据、临时数据和日志数据。
31、进一步地,所述卫星自治中心实现卫星自治的过程具体包括如下步骤:
32、(1)星载算力单元通过边缘核心模块从云端核心模块接收星载应用创建请求消息,并将星载应用元数据写入分布式数据库系统中;
33、(2)当卫星自治中心的应用控制器监测到星载应用出现异常时,应用控制器从分布式数据库系统中获取异常星载应用的所有元数据;
34、(3)卫星自治中心的应用解析器根据星载应用的元数据及状态信息,对异常星载应用进行分类,并根据预设的不同分类信息执行对应的预设的服务自治策略;
35、(4)卫星自治中心的节点控制器从分布式数据库系统中获取卫星自治联盟中的所有星载算力单元的元数据;
36、(5)卫星自治中心的应用调度器根据异常星载应用元数据,对卫星自治联盟中的所有星载算力单元依据预设的优选节点要求和打分策略进行过滤和打分,从中筛选出分数最高的星载算力单元作为目标星载算力单元,将该异常星载应用迁移至目标星载算力单元并重新启动该异常星载应用;
37、(6)异常星载应用完成迁移后,卫星自治中心的清理回收器将异常星载应用元数据从分布式数据库系统中清除,然后发送请求给边缘核心模块完成该异常星载应用的清理工作;
38、(7)迁移并部署异常星载应用的新目标星载算力单元,并定期同步迁移重启后的星载应用的最新状态信息给云端核心模块进行星地数据同步;
39、(8)云端核心模块通过kubernetes的api服务器组件更新kubernetes集群的分布式数据库中星载应用的元数据。
40、与现有技术相比,本发明的有益效果是:
41、(1)本发明在kubeedge平台提供的边云协同基础上,通过对云端核心(cloudcore)模块实现天基系统定制化特性,并在边缘核心(edge core)模块部署卫星自治中心、分布式数据库系统、分布式存储系统,达到卫星集群内星载应用异常时自动重启或自动迁移的效果,可适应卫星运行控制间断、管控不及时等常见情况,实现离线卫星自动化运维,进而达到了卫星离线自治的目的。
42、(2)本发明在kubernetes应用编排系统上,通过对kubernetes的api服务器(api-server)/控制器管理(controller-manager)模块实现天基系统定制化特性,实现了离线卫星完全自治、自动化星地数据协同的高效率计算,进而达到了星地智能协同的目的。
43、(3)本发明的卫星自治中心提供了星载应用迁移接口,提供给用户简单易用的交互接口,使得星载应用不仅可以实现异常时自动迁移,用户也可以手动完成星载应用的迁移操作。
44、(4)本发明基于kubeedge搭建,并通过重组kubeedge中的部分功能模块,对kubeedge中不必要的部分进行了精简,大大减少了内存占有量,提高了资源利用率,同时也降低了星载算力单元的内存消耗,使得kubeedge平台真正达到了轻量级的层次。
45、(5)本发明使用https通信加密协议,当调用卫星自治中心星载应用迁移接口时,基于互信键值对的验证方法进行身份验证,保证了天基分布式系统的安全。
本文地址:https://www.jishuxx.com/zhuanli/20240808/272251.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表