Node0模拟算法环境,在每一帧获取屏幕上个体的位置和速度,考虑到各个小车运动速度可能存在误差导致不同步,输出位置的话,在每一帧各个小车可能不能同步到达指定位置,因此算法仅输出为速度方向/速度。Node1为桌面上小车,每一帧将小车实际的位置和速度方向推送给算发环境,从而使算法基于小车的实际的位置和速度方向计算。
注入故障扰动
-
不动的话,可以直接按住
-
随机运动
-
向集群相反方向运动
对于node0,其实其不用进行update position,就算更新了,也会被桌面小车的实际节点的位置的和速度所覆盖。
Node0和Node1是否都需要这样写? 对于随机运动和向集群相反方向运动,很好模拟,因为也会有角度。
其实对于node1来说,其不用进行更新的,它直接输出位置就行
数据采集
如果加载强化学习的话,需要执行step前,通过处理造一个观察空间,然后根据观察空间,执行策略即可,可直接迁移