而另一边,王建成已经设置好了模型的基本参数,也连接上了模拟飞行程序。</P>
在之后的训练里,模型将会根据飞行程序输入的随机指令自动开始学习,用高频率的试错逐渐去寻找收益最大的策略。</P>
“所以你们的判据是最后怎么设置的?还是之前说的那样,以跟随距离为标准吗?”</P>
楚建树开口问道。</P>
“不是,已经改了。这个判据太死板了,如果只使用距离作为判据,虽然成功率高,但同时,一旦失败,造成的后果也很严重。”</P>
“我们没办法把预估损失也作为判据加进去,那样的话,整个模型会变得太过庞大。”</P>
“即使我们现在的小型机跑得动,以后真上了无人机也跑不动。”</P>
“所以,最后的策略是,使用归队成功率作为主权重判据,距离只作为辅助。”</P>
听到陈念的回答,楚建树眼前一亮。</P>
这的确是一个很聪明的策略。</P>
作为编队中的重要部分,毫无疑问,无人机是要跟有人机组成飞行编队的,但由于性能上的差异,编队的队形不可能永远保持稳定。</P>
----别说有人、无人混编了,哪怕纯粹的有人机编队,也不可能在战斗中始终保持队形。</P>
但另一方面,如果想要形成战斗力,编队、分组又是必须的。</P>
这就要求飞行员在完成战术动作之后迅速归位。</P>
以此为标准,去约束无人机的行动,并作为机器学习训练的判据,一方面给了模型更大的自由度,一方面也能满足实际使用的需求,可以说是折中情况下最好的选择了。</P>
这两小子不愧是天才啊,一法通万法通,为了这个模型,他们所掌握的绝对不仅仅是单一的人工智能知识而已。</P>
面向对象的开发,才是真正有用的开发啊。</P>
不过,一个普通的学生,怎么会有这样的见识呢?</P>
----他还不知道,此时的陈念,对于空军战术的了解,其实都是已经有过实践经验的了.......</P>
“很聪明,这应该是我们最好的解决方案了。咱们现在就开始吗?”</P>
“现在开始!”</P>
王建成点了点头,手指轻敲回车键。</P>
伴随着小型机的风扇转动,程序立刻开始了运转。</P>
一条条数据不断输入到模型中,由于没有可视化界面,所有的学习过程都是以数据的形式呈现。</P>
楚建树看的都不太明白,倒是王建成,一边紧紧盯着疯狂闪烁的一行行代码,一边不断地开口解释:</P>
“已经完成一千次训练了,效果很差,成功率0%......不过也正常,我估计至少要训练百万次以上,才能达到初步的效果。”</P>
“五千次,这算成功了一次,有一架无人机归队了,但这是运气,策略还没办法形成......”</P>
时间一分一秒地过去,随着程序的不断运转,王建成的脸色变得越来越凝重。</P>
原因无他,成功率太低了!</P>
这个模型的训练效果远远要弱于他的预期,如果按照这样的效率,恐怕亿级的训练都不够用。</P>
那还玩个屁啊?</P>
机器学习中有一条铁律:</P>
当AI的训练强度大于人工训练强度时,那模型就是无效的。</P>
很显然,他手里的这个模型,就是这样的情况。</P>
“不太行啊......这个算法好像达不到可用的标准。”</P>
“训练效率太过低下了,策略生成的速度也慢。”</P>
“这么搞下去,我们还不如人工遍历定制策略来的划算了......”</P>
听到他的话,陈念也皱起了眉头。</P>
他开口问道:</P>
“能看出原因吗?”</P>
“看不出来......我感觉咱们的算法应该是没什么大问题的,但是,冷启动耗费的资源太多了。”</P>
“机器学习的本质也是遍历,但它没办法做任何感性经验的参考。”</P>
“也就是说,人工先验和机器先验拉不齐.......”</P>
广告位置下