K1体育 - 十年品牌 值得信赖

基于人工智能的仿真平台

详情

简介

   当前环境下,随着武器装备技术的发展参与作战的武器装备越来越复杂,指挥控制系统所需采集的信息及控制的参数越来越多而造成系统负荷重指挥人员工作负荷大而且指挥员、各类武器装备、战场环境等构成特定情境的组成成分常常会发生快速的变化,在这种快节奏的态势演变中,由于没有充分的时间和足够的信息来形成态势的全面感知、理解,难以准确地对未来态势进行预判。

   随着人工智k1体育官网能技术的迅猛发展,人工智能技术越来越多的应用到各行各业。将人工智能技术应用于新一代作战指挥系统设计中,构建基于人工智能的仿真平台,模拟未来作战任务中复杂多变的自然环境和敌方战术策略等,使用人工智能判断、决策和人机交互,能最快最精准地实行打击任务,并且能最大程度的保护军事人才并且节约物力、财力的输出。

基于人工智能的仿真平台在原有的传统仿真平台基础上构建,采用深度神经网络与强化学习等关键技术,研制具有指挥控制决策能力的作战智能体。该智能体具有在仿真平台中的自学习能力,在训练中不断提升自身的决策水平,指挥其所控制的兵力协同完成作战任务。

功能模块组成

基于人工智能的仿真平台由智能接口、作战智能体构k1体育官网建、作战智能体自学习三个模块组成。

各个模块之间的交互关系如下图所示:

基于人工智能的仿真平台-正文配图1.png


智能接口模块

智能仿真平台是作战智能体训练最重要的组成部分,由传统仿真平台及智能接口模块组成,通过开发智能接口,使平台智能化作战智能体在智能仿真平台中学习,进行智能态势解读、智能决策、智能研判。

每个仿真周期内,其内部模型按照各自功能运行,并将环境信息输出至作战智能体,智能体感知环境信息后,依据自身神经网络结构,输出行为决策至环境,环境收到决策后,将决策评价发送至智能体,智能体根据自身学习策略,优化神经网络参数。

作战智能体构建模块

作战智能体构建是指采用智能仿真的方法,使作战智能体可以接入智能仿真环境中进行训练。通过感知仿真k1体育官网平台中各种异构数据组成的战场态势,如图像、指令等,形成智能体在某一时刻的状态,通过不同的神经网络(如模糊神经网络、卷积神经网络等)对异构数据进行处理,形成统一的数据格式。通过共享神经网络,产生输出决策至作战智能仿真平台,引导协同兵力行动。智能仿真环境根据决策所产生的效果,发送本次决策评价至智能体指挥引导规则学习模块,依据预设的规则学习策略更新网络参数。如此在智能仿真环境中进行海量训练,作战智能体通过自主学习,具有了自主决策能力。

通过作战智能体构建方法的建设,在智能仿真平台中,在自学习方法的指导下,作战智能体采用深度神经网络的形式学习和存储战术,不断提高自身智能水平。

作战智能体自学习模块

作k1体育官网战智能体自学习方法建设使作战智能体具有对战术规则的学习能力,在决策规则的指导下,通过在智能平台中进行大量训练,决策能力不断提高。智能体自学习方法包括智能体指挥控制规则学习方法多场景协同训练方法两种。

1.智能体指挥控制规则学习方法

此方法是一种基于策略和基于价值相融合的强化学习训练方法,方法框架如下图所示:

基于人工智能的仿真平台-正文配图2.png

思维决策方法使作战智能体具有了学习能力,可以理解为指挥员的大脑,这个大脑包含了两个部分:策略-行为神经网络和价值-评判神经网络。其中策略-行为网络是大脑的执行机构,输入感知态势,然后输出决策。而价值-评判网络则可认为是大脑的价值观,根据预测态势、感知态势及环境评价进行自我调整,使自身越来k1体育官网越正确,然后影响整个策略-行为网络。

2.多场景协同训练方法

训练采用多场景协同的强化学习方法,即将作战智能体复制多份,在不同的线程、不同的智能仿真平台中进行训练,并将训练结果汇集返回至中央作战智能体进行整合