一种推演仿真环境下多方案智能切换系统

2022-08-10 17:11:51 来源：中国专利 TAG：

1.本发明涉及信息管理领域，具体涉及一种推演仿真环境下多方案智能切换系统。

背景技术：

2.联合作战智能对抗推演是“背靠背”式的。在每场推演对抗开始前，会公开双方所处战场环境和兵力构成等详细信息。同时还会明确此次对抗中各方的任务目标，以及相应的胜负积分规则。除此以外，红蓝双方的行动方案、兵力部署，以及行动计划，都是相互透明的。推演对抗开始后，通常需要先运用必要的侦察手段来获知对方的兵力初始部署和兵力调动信息，使得本方兵力智能体能够根据此态势情况以及后续变化，按照对抗规则和预定作战行动方案不断实施相应的作战行动，直至分出胜负或者推演时间结束。整个推演过程，既是红蓝双方智能体应变能力的较量，又是对抗双方作战行动方案优劣的比较。
3.联合作战智能对抗推演可以通过多轮次的模拟仿真，对同一作战构想下的具体方案进行反复打磨优化，是一种面向指挥作业单位的，揭示作战规律，熟悉装备运用，训练指挥能力的有效手段。对抗双方需要根据对目标任务与战场环境的理解，以及对敌方实力的分析，提前研判对方可能的兵力部署与作战计划，进而确定本方兵力部署，并制定相应的行动计划。在联合作战推演仿真过程中，如果能准确预测对方的作战部署与行动计划，便可以有针对性的安排本方作战部署，制定最有利的行动方案，从而在一开始就为最终的推演结果奠定胜利基石。然而，由于战争迷雾的存在，战场情况复杂多变，具有很高的不确定性，对抗推演过程中往往难以提前掌握对方真实情况，这给制定方案带来了巨大的困难和挑战，从而对指挥员提出了较高的能力要求。
4.一套严谨细密、周全详细的方案，往往需要考虑多种可能敌情下的应对措施，从而保证本方有较高的获胜概率。但由于作战对抗的不确定性和复杂性特点，仅凭一套方案往往难以应对多种不同敌情。同时，由于制定详细的方案复杂度较高，而基于一套方案进行临时调整，不仅难度极大，而且仓促下也通常难以考虑周全，面临较大的失败风险。基于单一行动方案，很难保证在未知、多变的战场环境中稳操胜券，反而有可能被对方克制打压。因此急需要提供一套管理系统，可以提供多种方案的管理。

技术实现要素：

5.为了解决现有技术中所存在的问题，本发明提供一种推演仿真环境下多方案智能切换系统，包括：
6.方案定义模块，用于基于工厂模式对各种行动方案进行静态定义，每个行动方案的静态定义均包括：方案名称、兵力部署；所述兵力部署由装备体现；
7.方案管理模块，用于基于工厂模式对方案定义模块中定义的多种行动方案进行实例化；还用于与智能对抗推演仿真系统在对抗过程中进行数据交互。
8.优选的，所述兵力部署包括：各种装备及装备的初始坐标。
9.优选的，所述方案定义模块包括：方案基类和针对所述各方案基类实现的多个方
案类；每个方案类均对应一种方案；
10.所述方案基类用于定义方案基础信息的变量成员和行为逻辑的接口成员；
11.其中所述变量成员至少包括下述中的一种或多种：方案名称，装备型号、数量、部署位置；所述接口成员至少包括各装备行动计划。
12.优选的，所述数据交互包括：基于智能对抗推演仿真系统对实例化后的行动方案进行切换；以及根据智能对抗推演仿真系统推演情况对各实例化后的行动方案进行维护。
13.优选的，所述方案管理模块由方案管理类实现：所述方案管理类包括方案工厂类；
14.所述方案工厂类用于通过各方案类中的接口定义具体的行为逻辑进而实例化具体的方案对象。
15.优选的，所述方案管理模块包括：
16.方案创建子模块，用于调用方案工厂类实例化各行动方案，并存储于方案列表中；
17.管理数据维护子模块，用于基于智能对抗推演仿真系统的推演维护方案列表中各行动方案的信息；
18.方案切换子模块，用于基于智能对抗推演仿真系统的推演从方案列表中选择下场推演的行动方案。
19.优选的，所述下场对抗的行动方案包括：
20.当推演结束后己方获胜，则保持当前行动方案作为下场推演的行动方案，否则，检查当前己方行动方案与对方行动方案对抗是否达到最小试探推演场数min(r
test
)；
21.若未达到最小试探推演场数min(r
test
)，则下场继续使用当前行动方案；若已达到最小试探推演场数min(r
test
)，则切换为所述方案列表中当前行动方案的下一个行动方案作为下场推演的行动方案。
22.优选的，所述最小试探推演场数min(r
test
)的计算式如下；
[0023][0024]
式中，e为用户期望的推演结果置信度，ε为系统的推演结果置信度。
[0025]
优选的，所述管理数据维护子模块具体用于：
[0026]
获取预先确定的己方方案列表；所述己方方案列表包括至少一个己方行动方案；
[0027]
利用对抗推演仿真系统，基于预设对抗推演场次数量，从己方方案列表切换行动方案进行对抗，并根据每场对抗结果对己方方案列表中各行动方案的信息进行维护。
[0028]
优选的，所述各行动方案的信息包括：各行动方案的排序、行动方案i对抗推演历史总得分以及历史场均得分
[0029]
优选的，所述行动方案i对抗推演历史总得分的计算式如下；
[0030][0031]
式中，ri为当前行动方案i的已推演场数；为；己方行动方案i的第j场对抗推演的得分；
[0032]
所述行动方案i历史场均得分的计算式如下：
[0033][0034]
与现有技术相比，本发明的有益效果为：
[0035]
本发明提供一种推演仿真环境下多方案智能切换系统，包括方案定义模块和方案管理模块；方案定义模块用于基于工厂模式对各种行动方案进行静态定义，每个行动方案的静态定义均包括：方案名称、兵力部署；方案管理模块用于基于工厂模式对方案定义模块中定义的多种行动方案进行实例化；还用于与智能对抗推演仿真系统在对抗过程中进行数据交互；本发明能够在大型多回合制对抗推演过程中，提前制定多套备选方案，以便在对抗正式开始前，根据获知的态势情报和历史对抗数据，确定方案切换时机以选择最合适的方案，从而大大提高了获胜的概率；
[0036]
本发明提供的技术方案引入工厂模式，使得软件结构更为简洁合理，开发更为敏捷高效。
附图说明
[0037]
图1为本发明的多方案智能切换系统结构示意图；
[0038]
图2为本发明主要类的结构与关系示意图；
[0039]
图3为本发明的主要对象间消息交互时序图；
[0040]
图4为多行动方案自动切换的最优行动方案流程图；
[0041]
图5为行动方案预判流程图；
[0042]
图6为三种情况推演测试结果对比图。
具体实施方式
[0043]
为了更好地理解本发明，下面结合说明书附图和实例对本发明的内容做进一步的说明。
[0044]
实施例1
[0045]
本发明提供的一种推演仿真环境下多方案智能切换系统，如图1所示包括：方案定义模块和方案管理模块。方案定义模块用于基于工厂模式对各种行动方案进行静态定义，每个行动方案的静态定义均包括：方案名称、兵力部署；所述兵力部署由装备体现；方案管理模块，用于基于工厂模式对方案定义模块中定义的多种行动方案进行实例化；还用于与智能对抗推演仿真系统在对抗过程中进行数据交互。
[0046]
其中，方案定义是指确定各个方案的具体内容，包括装备初始部署位置和相应的作战行动等；所述方案管理模块包括：方案创建子模块、管理数据维护子模块和方案切换子模块。
[0047]
方案创建子模块，用于调用方案工厂类实例化各行动方案，并存储于方案列表中；
[0048]
管理数据维护子模块，用于基于智能对抗推演仿真系统的推演维护方案列表中各行动方案的信息；
[0049]
方案切换子模块，用于基于智能对抗推演仿真系统的推演从方案列表中选择下场推演的行动方案。其中，基于智能对抗推演仿真系统的推演从方案列表中选择下场推演的行动方案需要根据各方案的推演结果，按得分由高到低的顺序对本方所有方案进行优先排
序。
[0050]
具体分析来说，在软件设计与实现上，方案定义的重点是生成各个具体的方案对象。由于每个方案对象的结构相同，都包含有装备初始部署位置和作战行动这两个属性，而具体的属性数据或行为逻辑不同，因此只需要用户确定上述属性数据或行为逻辑即可。这是一种较为典型的创建对象场景。在软件工程的设计模式领域中，工厂模式是最常用也最经典的创建型模式，对用户隐藏了对象的创建步骤，通过一个共同的软件接口来指向新创建的对象，只需要用户根据实际情况或需求定义对象中的必要信息。基于此，本发明在软件的方案定义模块部分引入工厂模式，使得软件结构更为简洁合理，开发更为敏捷高效。
[0051]
同时，按管理层次划分，软件又可以按集中管理与单独管理分为两个层级。其中，集中管理是指对所有本方方案的管理，主要是维护更新方案优先排序列表；单独管理则是对每个方案的单独管理，主要是方案的定义和属性数据的更新。具体分析来说，集中管理内容包括推演中，方案管理相关的信息、数据维护，以及方案调度规则。在工程实践中，将这一层次抽象为方案管理类。其中，相关信息、数据包括用户预设总方案数、总推演场数、系统推演结果置信度、用户设定的期望可信度、各作战方案初始胜算度、用户设定的单场推演期望得分等，将这些抽象为类的变量成员，将方案调度规则体现了调度行为，抽象为类的函数成员。而单独管理，是每个方案有一个独属的管理类，主要内容是该方案所独有的特征信息，包括该方案下初始的装备部署数据、方案的推演场均得分，以及为了达到方案的作战意图，而制定的系列作战行动等。其中，装备部署数据、方案的推演场均得分被抽象为类的变量成员，而作战行动被抽象为类的函数成员，并提供接口，以便具体实现。
[0052]
综上所述，本发明的软件实现在设计上，采用面向对象的设计思想，抽象出方案类和方案管理类；采用“模块之间松耦合，模块内部高内聚”的软件设计理念，合理划分业务逻辑，将联系紧密的逻辑功能聚合在一起形成完整的功能模块；采用设计模式中经典的工厂模式，便于创建和定义新的方案。
[0053]
图1中上一层是方案管理模块下面是负责各具体方案的方案定义模块。其中，方案管理模块主要负责创建方案、切换方案，维护管理所必须的信息数据，以及同智能抵抗推演环境交互，将方案应用于每场推演，同时根据推演结果的反馈调整方案优先排序，该部分不涉及各个方案的具体逻辑或实现细节。而下一层的方案定义模块，则只专注于各方案的具体实现细节，如兵力部署、作战行动等，不考虑方案管理逻辑。通过采取这种设计思路，将方案管理与方案实现相分离，各业务类“各司其职”，使得软件结构更清晰，便与软件的工程实现、调试，以及后续的维护、升级。
[0054]
在具体工程实现上，由于引入了“工厂模式”，软件设计主要包括4个类：方案管理类、方案工厂类、方案基类和方案类，类及其相互关系如图2所示。
[0055]
其中，方案管理类负责基础性、共性信息以及方案的管理，以及方案切换逻辑。方案类主要包括对应各方案基础信息的变量成员以及定义行为逻辑的接口成员。方案工厂类主要用于实例化具体的方案对象，然后可通过方案类中的接口定义具体的行为逻辑。在方案管理类中设有一个方案工厂类对象，用户可通过该工厂对象，“生产”新方案，进而通过调用新方案对象的接口，定义新方案的数据与行为。
[0056]
有关方案管理与推演系统，以及用户间消息交互的顺序如图3所示。
[0057]
在用户成功打开推演系统后，系统会在后台实例化一个方案管理对象。接着，用户
根据预先设计好的方案，按照系统给定的接口，定义若干个方案，此时会确定一个初始最优方案，作为推演一开始的默认方案。然后，用户设定总推演场数，并启动推演，进入推演循环。在循环中，每进行最小试探场数推演后，会更新推演统计结果，并相应调整方案优先排序，重新确定最优方案，并将推演方案切换为当前最优方案，再进行最小试探场数推演，直到所有推演全部完成。最后，返回推演总体结果。
[0058]
实施例2
[0059]
利用本发明提供的一种推演仿真环境下多方案智能切换系统可以实现：
[0060]
一种面向智能对抗的多方案自主切换方法，包括：
[0061]
s1、获取预先确定的己方行动方案列表；所述己方行动方案列表包括至少一个己方行动方案；
[0062]
s2、利用对抗推演仿真系统，基于预设对抗推演场次数量，从己方行动方案列表切换行动方案进行对抗，并根据对抗结果对己方行动方案列表中各行动方案进行排序；
[0063]
s3、基于所述己方行动方案排序结果确定最优行动方案。
[0064]
优选的，所述利用对抗推演仿真系统，基于预设对抗推演场次数量，从己方行动方案列表切换行动方案进行对抗，并根据对抗结果对己方行动方案列表中各行动方案进行排序，包括：
[0065]
步骤1：从预先确定的己方行动方案列表中选择第一个己方行动方案；
[0066]
步骤2：基于己方行动方案与对方行动方案利用智能对抗推演仿真系统进行对抗，并记录对抗情况；根据对抗情况从己方行动方案列表中确定下场对抗的己方行动方案，并判断是否达到对抗推演场次，如果达到则执行结束；否则执行步骤3；
[0067]
步骤3：当己方行动方案列表中所有行动方案执行完成后，基于历史对抗情况对己方行动方案列表中所有己方行动方案进行排序；
[0068]
步骤4：从排序后的己方行动方案列表中选择第一个己方行动方案执行步骤2，直到达到预设对抗推演场次，执行结束。
[0069]
优选的，所述记录对抗情况，包括：
[0070]
记录己方行动方案i的第ri场对抗推演的得分当前行动方案i的历史推演总得分以及相应的历史推演场均得分
[0071]
优选的，所述当前行动方案i的历史推演总得分的计算式如下；
[0072][0073]
所述当前行动方案i的历史场均得分的计算式如下：
[0074][0075]
式中，ri为当前行动方案i的已推演场数；为己方行动方案i的第j场对抗推演的得分，其中j的取值为1到ri。
[0076]
优选的，所述从预先确定的己方行动方案列表中选择第一个己方行动方案之前还
包括：
[0077]
对每个行动方案设定最小试探推演场数min(r
test
)；
[0078]
所述最小试探推演场数min(r
test
)根据系统的推演结果置信度ε和用户期望的推演结果置信度e计算确定。
[0079]
优选的，所述最小试探推演场数min(r
test
)的计算式如下；
[0080][0081]
式中，e为用户期望的推演结果置信度，ε为系统的推演结果置信度。
[0082]
优选的，所述根据对抗情况从己方行动方案列表中确定下场对抗的己方行动方案，包括：
[0083]
如果本场己方胜利，则己方行动方案列表中当前选择的己方行动方案为下场对抗的己方行动方案，否则，检查当前的己方行动方案与当前对方行动方案的对抗次数是否达到最小试探推演场数min(r
test
)；
[0084]
当若未达到最小试探推演场数min(r
test
)，则下场对抗继续使用当前选择的行动方案，否则，选择己方行动方案列表中当前选择的方案的下一个方案为下场对抗的己方行动方案。
[0085]
优选的，所述基于各场对抗情况对己方行动方案列表中所有己方行动方案进行排序，包括：
[0086]
基于己方行动方案列表中各方案的历史场均得分进行排序。
[0087]
优选的，所述从己方行动方案列表切换行动方案进行对抗，之前还包括：
[0088]
初始化下述中的至少一个或多个参数：用户预设方案总数i，总推演场数r，用户期望的推演结果置信度e，本方各行动方案胜算度初值psi，以及单场推演期望得分的初值
[0089]
对己方行动方案列表中的己方行动方案设置行动方案胜算度初值psi，并根据所述行动方案胜算度初值设定己方行动方案列表的初始排序；
[0090]
根据系统的推演结果置信度ε和用户期望的推演结果置信度e，计算确定最小试探推演场次min(r
test
)。
[0091]
优选的，所述基于己方行动方案与对方行动方案利用智能对抗推演仿真系统进行对抗，并记录对抗情况，之后还包括：
[0092]
判断所述对方行动方案是否为新的对方行动方案，如果是则存储于对方行动方案列表中。
[0093]
优选的，所述判断所述对方行动方案是否为新的对方行动方案包括：
[0094]
基于智能对抗推演仿真系统获取对抗方装备及各装备的初始部署位置，并将所述对抗方装备及各装备的部署位置作为行动方案；
[0095]
将所述行动方案与预先存储的所有的对抗方行动方案进行比对，当所述行动方案与所述所有的对抗方行动方案都不相同时，所述行动方案被确认为对抗方的新行动方案；
[0096]
所述存储的所有的对抗方行动方案包括：装备及各装备的初始部署位置。
[0097]
上述方法使用的变量如表1所示
[0098]
表1所用变量
[0099][0100][0101]
其中，每场推演结果的置信度ε为系统内定，表示该场推演结果的可信程度，由系统自身的设计与实现所决定，不由用户设定，也不随推演条件的变化而改变；期望推演结果置信度e，由用户根据自己的偏好设定，表示用户满意的、期望达到的推演结果置信度。由上述两个参数可以确定最小试探推演场数min(r
test
)，即达到用户认可的、信服的推演结果置信度，最少需要进行的推演场次。通常情况下，用户设定的期望推演结果置信度e会大于系统内定每场推演结果置信度ε，需要进行至少min(r
test
)场推演，提高推演结果置信度，使用户认为推演结果达到满意程度，此时当前所采用作战方案的整体获胜概率及得分才是可信的、可用的。
[0102]
相关计算公式如下
[0103][0104]
公式变形后，得到
[0105][0106][0107]
类似的，还设定了单场推演期望得分s
exp
，表示用户满意的单场推演最小得分，并由用户设定其初始值推演开始后，首先按照各行动方案胜算度初值由高到低排序，选取排序第一的行动方案进行min(r
test
)场推演，并计算单场平均分，如果低于当前的单场推演期望得分，则认为该行动方案经过推演验证后并不理想，将该行动方案放入排序队尾，并
自动切换当前排序中的下一行动方案准备进行下一场推演；否则，继续保持当前行动方案继续进行min(r
test
)场推演。如此循环，直到推演结束。
[0108]
下面对本发明提供的技术方案的做进一步的介绍，如图4所示：
[0109]
1)：算法初始化。
[0110]
1.1)初始化各参数，包括用户预设方案总数i，总推演场数r，用户期望的推演结果置信度e，本方各行动方案胜算度初值psi，以及单场推演期望得分的初值
[0111]
1.2)：按照行动方案胜算度初值psi，对用户预设方案按照逆序进行排列，得到优先排序列表，并初始化列表指针指向第一个方案。
[0112]
2)：根据系统的推演结果置信度ε和用户期望的推演结果置信度e，计算最小试探推演场次min(r
test
)，具体计算如公式(3)所示。
[0113]
3)：选择优先排序列表中，列表指针所指向的行动方案i，进行min(r
test
)场推演，记录各场推演得分，并计算该min(r
test
)场试探推演的的历史推演总得分以及相应的历史推演场均得分
[0114][0115][0116]
4)：判断当前列表中的所有行动方案是否都已推演过。
[0117]
(1)如果是，即已将当前列表中所有意图轮换一遍，则根据各意图的场均得分重新排序，得到一个新的优先排序列表，重置列表指针为1，选择指针对应的行动方案进行下场推演，转步骤5)。
[0118]
(2)如果不是，列表指针指向当前优先排序列表中的下一个行动方案，并选择该行动方案进行下一场推演，转步骤3)。
[0119]
5)：对推演场数ri进行判断。
[0120]
如果ri《r更新ri＝ri 1，转步骤3)；否则，算法结束。
[0121]
实施例3
[0122]
在实施例1和2中判断对方行动方案是否为新的对方行动方案，可以采用面向推演仿真的行动方案预判方法，该方法包括：
[0123]
1)基于智能对抗推演仿真系统获取对抗方装备及其初始部署位置，并将所述对抗方各装备及其部署位置作为备选行动方案；
[0124]
2)将所述备选行动方案与预先存储的所有的对抗方行动方案进行比对，当所述备选行动方案与预先存储的的对抗方行动方案都不相同时，所述备选行动方案被确认为对抗方的一个新行动方案意图；
[0125]
对抗方行动方案包括：装备及各装备的初始部署位置；所述存储的所有的对抗方行动方案包括：历史推演发现并存储的对抗方行动方案。
[0126]
其中，1)基于智能对抗推演仿真系统获取对抗方装备及各装备的初始部署位置包括：
[0127]
在所述智能对抗推演仿真系统开始执行对抗时获取对抗方所有装备，以及各装备的坐标位置；
[0128]
所述备选行动方案以各装备编号以及各装备的坐标位置顺序组成的数组向量进行表示；
[0129]
所述坐标位置包括二元数组或三元数组。
[0130]
对抗方行动方案中装备的初始部署位置为坐标位置；这里坐标位置包括：二元数组或三元数组。
[0131]
进一步的，将所述备选行动方案与预先存储的所有的对抗方行动方案进行比对，当所述备选行动方案与预先存储的对抗方行动方案都不相同时，所述备选行动方案被确认为对抗方的一个新行动方案，包括：
[0132]
步骤1：从对抗方行动方案列表中选取第一个行动方案；
[0133]
步骤2：以当前选取行动方案中各装备编号以及各装备的坐标位置顺序组成的数组向量对所述当前选取行动方案进行表示；
[0134]
步骤3：计算所述备选行动方案与当前选取行动方案的欧氏距离；
[0135]
步骤4：基于欧氏距离判定所述行动方案与当前选取行动方案的相似度；
[0136]
步骤5：当相似度在设定阈值范围内，所述备选行动方案与当前选取行动方案为同一方案或相近方案，结束比对；否则，执行步骤6；
[0137]
步骤6：判断行动方案列表中是否还有未被选取的行动方案，若有，则继续从行动方案列表中获取下一个行动方案，并执行步骤2；若没有，则所述行动方案被确认为对抗方的一个新行动方案，结束比对；
[0138]
其中，所述对抗方行动方案以行动方案列表的形式存储。
[0139]
进一步的，计算所述备选行动方案与当前行动方案的欧氏距离，包括：
[0140]
分别计算所述行动方案对应的数组向量和当前行动方案对应的向量数据中各装备间的欧氏距离；
[0141]
以各装备重要性进行加权，计算所述行动方案对应的数组向量和当前行动方案对应的数组向量间的欧氏距离。
[0142]
进一步的，当坐标位置为二元数组时，所述各装备在不同方案间的欧氏距离的计算式如下：
[0143][0144]
式中，为对抗方s的装备n在所述备选行动方案i与当前行动方案j间的欧氏距离；分别为所述备选行动方案i和当前行动方案j在x轴的坐标位置；分别为所述备选行动方案i和当前行动方案j在y轴的坐标位置；
[0145]
当坐标位置为三元数组时，所述各装备在不同方案间的欧氏距离的计算式如下：
[0146][0147]
式中，分别为所述备选行动方案i和当前行动方案j在z轴的坐标位置。
[0148]
进一步的，数组向量间的欧氏距离计算式如下：
[0149][0150]
式中，为对抗方s的装备n在所述备选行动方案i与当前行动方案j间的欧氏距离；为方案i和j的两个数组向量间的加权欧氏距离；为s方装备n在s方所有装备中的权重。
[0151]
进一步的，相似度的计算式如下：
[0152][0153]
式中，f为相似度；为方案i和j的两个数组向量间的加权欧氏距离；为s方所述备选行动方案i对应的数组向量到所在坐标系原点的距离；为s方当前行动方案j对应的数组向量到所在坐标系原点的距离。
[0154]
进一步的，当所述备选行动方案被确认为对抗方的新行动方案之后还包括：将所述新行动方案存储于对抗方行动方案列表中。
[0155]
利用本实施例提供的一种面向推演仿真的行动方案预判方法，通过深入考虑分析行动双方态势信息，在双方实力的基础上，提前制定多套作战方案，以便在行动正式开始前，根据获知的态势情报和历史对抗数据，确定方案切换时机以选择最合适的行动方案，从而大大提高了获胜的概率。
[0156]
对算法使用的变量及其含义如表2所示。
[0157]
表2行动方案预判算法所用变量
[0158][0159][0160]
补充说明：
[0161]
1.本算法采用装备初始部署位置代表行动方案，因此行动方案可表示为
[0162]
2.方案相似度阈值是由用户设定的两个方案的最大偏差，作为判定方案是否相近或相似的标准。
[0163]
算法的假设条件有：
[0164]
1.联合行动智能对抗共进行round场推演；
[0165]
2.每方均有ns种装备，
[0166]
3.每方所属各装备具有重要性权重，
[0167]
4.双方每场推演采用的行动方案均不公开；
[0168]
5.方案相似度阈值由用户根据偏好自行设定。
[0169]
算法的目标函数为：
[0170][0171]
式中，f为相似度；为方案i和j的两个数组向量间的加权欧氏距离行动行动；为s方备选行动方案i对应的数组向量到所在坐标系原点的距离；为s方当前行动方案j对应的数组向量到所在坐标系原点的距离。
[0172]
由于算法的目的是判断两个行动方案是否相似或相近，甚至相同，因此，在用数组向量表示行动方案的基础上，以两个数组向量(简称为)间的加权欧式距离作为主要判断依据。为了更为直观的表示该加权欧式距离的大小，通过将其与某一数组向量到坐标原点的欧式距离相比来进行归一化处理，以该比值作为最终的目标函数。在被比较数组向量的选择上，目标函数采用选取较大者的方案，即以作为分母，以减小选取较小者可能造成的误差。将任一目标函数值与用户预设的相似度阈值进行比较，若大于等于阈值，则认为所比较的两个行动方案的差距在可接受范围内，判定两者相似或相近；否则，则认为两个行动方案的差距较大，判定两者不同。
[0173]
下面对本发明提供的技术方案的做进一步的介绍，如图5所示：
[0174]
1：算法初始化。假定本方为红方。初始化推演场次r＝1，记录的对抗方为蓝方行动方案列表为空，初始化本方各行动装备重要性权值(当本方为蓝方时，算法类同)。
[0175]
2：进入第r
′
场推演。先根据已记录蓝方行动方案列表的长度，暂将该场推演对方采用的行动方案记为蓝方的第j个行动方案，通过情报侦察获取蓝方各装备初始部署位置则蓝方行动方案可被表示为由蓝方所有装备初始部署位置，按装备编号顺序组成的数组向量，即备编号顺序组成的数组向量，即
[0176]
3：判断对方是否采用了新行动方案。
[0177]
3.1遍历列表初始化列表指针j＝1
[0178]
3.2选取列表中列表指针所指蓝方行动方案对应的数组向量，计算两个数组向量间，按照装备重要性权值加权后的欧氏距离，具体公式为：
[0179][0180]
式中为对抗方s的装备n在所述行动方案i与当前行动方案j间的欧氏距离；为方案i和j的两个数组向量间的加权欧氏距离；为s方装备n在s方所有装备中的权重。
[0181]
3.3根据目标函数计算公式计算目标函数值f，并与用户设定的相似度阈值θ进行比较。若f＜θ，即相似度小于阈值，认为两个数组向量不同，转步骤3.4；否则，相似度大于等
于阈值，认为两个数组向量基本相同，转步骤3.5。
[0182]
3.4比较j与列表长度判断列表是否已遍历完。若表明还未遍历完，转步骤3.2；否则，表明已遍历完，转步骤3.6。
[0183]
3.5由于判定两个数组向量基本相同，因此认为蓝方当前采取的行动方案与列表指针j指向的行动方案相似或相同，即行动方案不属于新行动方案，不添加到列表
[0184]
3.6若已遍历完列表，表明当前蓝方行动方案对应的数组向量与列表中任一数组向量都不相同或相近，因此可判定蓝方该行动方案属于没有记录在列表中的新行动方案，将该数组向量添加到列表中。
[0185]
4：检查推演是否结束。若r《r，表明推演场次小于预设总场数，场次数加1，r＝r 1，转2，继续下场推演；否则，算法结束。
[0186]
实施例4
[0187]
本实施例以一个具体的测试案例验证本发明提供的推演仿真环境下多方案智能切换系统的可行性与有效性。
[0188]
现有一套智能推演仿真系统，推演场景为海空联合对岛作战。用户为红方，系统智能为蓝方，推演双方都可提前设定多套作战方案。设定总推演场数为30，以30场推演累加的总分作为评判双方本轮对抗推演的成绩，通过比较双方成绩高低评判输赢。
[0189]
假定：系统内置推演可信度为0.5，用户期望的推演结果置信度为0.9；系统预设有2个方案，用户预设有3套作战方案t1，t2，t3，相应的初始胜算度为0.8，0.7，0.6；用户设定推演场均期望得分为40。
[0190]
根据前述方法和上述假定，通过系统内置推演可信度ε、用户自设期望可信度e，以及总推演场数r，计算确定最小试探推演场数min(r
test
)：
[0191][0192]
由公式(4)计算得到
[0193]rtest
≥4
[0194]
为保证每次实验推演场数相同，要求总场数r能被r
test
整除，所以最终确定即
[0195]
min(r
test
)＝5
[0196]
所以，推演总场数为30，最小试探推演场数为5，即每5场更新一次推演统计数据，称这样连续的5场为一小轮试验推演。同时，根据用户预设各方案的初始胜算度，初始化用户预设方案优先队列q＝《t1,t2,t3》。
[0197]
推演过程如下：
[0198]
1.第一小轮试验推演
[0199]
推演场次1-5，用户使用t1方案，本小轮红方场均得分20。蓝方场均得分40，通过对推演开始时态势分析，判断蓝方基本采用同一种作战方案，命名为p
1e
。
[0200]
2.第二小轮试验推演
[0201]
推演场次6-10，用户改用t2方案，本小轮红方场均得分42。蓝方场均得分22，通过对推演开始时态势分析，判断蓝方仍采用p
1e
作战方案。
[0202]
3.第三小轮试验推演
[0203]
推演场次11-15，用户使用t2方案，本小轮红方场均得分37。蓝方场均得分36，通过对推演开始时态势分析，判断蓝方采用了与前一种不同的作战方案，命名为
[0204]
4.第四小轮试验推演
[0205]
推演场次16-20，用户继续使用t2方案，本小轮红方场均得分40。蓝方场均得分22，通过对推演开始时态势分析，判断蓝方改采用了p
1e
作战方案。
[0206]
5.第五小轮试验推演
[0207]
推演场次21-25，用户仍使用t2方案，本小轮红方场均得分35。蓝方场均得分35，通过对推演开始时态势分析，判断蓝方改用了作战方案。
[0208]
6.第六小轮试验推演
[0209]
推演场次26-30，用户使用t2方案，本小轮红方场均得分42。蓝方场均得分19，通过对推演开始时态势分析，判断蓝方又改用了p
1e
作战方案。
[0210]
对比总结
[0211]
围绕多方案自主在线切换这一主要创新点，设计了两种对比情况，如表1所示，并继续使用上述案例进行测试。
[0212]
表1方案切换方法对比情况
[0213][0214]
其中，对比情况一的设定是，只采用当前用户默认最优方案t1进行所有场次的推演；对比情况二的设定是，仍进行多方案切换，切换方法是按预排好的顺序，间隔固定场次进行切换，而不是如本发明提出的根据推演统计结果切换。两种对比情况同样都进行推演，对比情况二中每间隔5场推演进行一次方案切换。
[0215]
两种对比情况的推演结果如表2所示。
[0216]
表2两种对比情况推演结果
[0217][0218]
进一步，统计本发明所提方案切换方法与两种对比情况推演结果的对比如图6所示。从图中可以看出，对比情况1的方案使用方法效果最差，红方完败于蓝方，对比情况2的效果好于对比情况1，但红方仍以一定劣势输于蓝方，本发明的效果最好，红方以一定优势胜于蓝方。
[0219]
分析总结
[0220]
1.关于作战意图的预判
[0221]
在推演过程中，第三小轮至第六小轮的试验推演中，都能够根据每场推演蓝方的初始装备部署位置信息，甄别判断蓝方是否采用了不同的作战方案，为推演结束后，复盘分析作战方案利弊优劣，提供了有力的依据。
[0222]
2.关于过程中方案的切换
[0223]
本发明的软件能够按照方法设定的规则，实现多方案间的自主在线切换，推演过程中无需进行人工暂停干预。
[0224]
第一小轮试验推演结束后，红方场均得分20，低于用户期望得分，而蓝方场均得分达到40，因此方案管理选择改用方案t2；第二小轮试验推演，蓝方没有改变装备初始部署位置，表明其作战意图以及相应的作战方案没有发生变化，该小轮结束后，红方场均得分提高到42，超过期望的满意值，而蓝方场均得分降低为22；第三小轮试验推演，方案管理仍使用方案t2，结果以微弱优势胜于蓝方；第四小轮试验推演，方案管理继续使用方案t2，结果红方场均得分为40，达到满意值，而蓝方场均得分下降到22；第五小轮试验推演，方案管理保持当前方案不变，同时观察到蓝方改变了装备初始部署位置，与已记录的蓝方作战方案特征相比较，判断蓝方改为使用前一套作战方案，推演结果红方场均得分下降，蓝方场均得分上升，双方持平；第六小轮试验推演，由于上一轮红方未输，仍保持当前方案不变，蓝方继续改变作战方案，此时双方方案对阵情况与第四轮相同，本次红方场均得分42，蓝方场均得分19，考虑随机因素的影响，结果在允许范围内也与第四轮基本一致。
[0225]
3.关于三种不同方案使用方法间的比较
[0226]
通过上述对比测试可以看出，对于多场次智能对抗推演，方案的设计与使用，包括
方案是否切换，以及如何切换，都会对最终推演结果、得分产生巨大影响。因此，非常有必要对是否进行方案切换，以及如何设计合理的方案切换方法进行研究，并提出符合实际需要的方案切换方法，以确保能够获得理想的推演结果与得分。
[0227]
通过上述复盘分析可以看出，方案管理能够根据设定的实验推演场数，根据场均结果自主在线切换方案，并根据历史结果重新定义方案优先级，达到了方法和软件的预期设计目的。
[0228]
显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。
[0229]
本领域内的技术人员应明白，本技术的实施例可提供为方法、系统、或计算机程序产品。因此，本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0230]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0231]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0232]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0233]
以上仅为本发明的实施例而已，并不用于限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均包含在申请待批的本发明的权利要求范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种选区激光熔化沉积制备轻量化高铁制动盘的方法

一种推演仿真环境下多方案智能切换系统

相关文献

最热文献