Jh
Jh
Ok, I will try what you said, thank you very much for your reply!
还想请问下,对于目标点随机初始化的情况,是否不合适采用累计奖励作为衡量算法性能的指标呢?当随机目标点离无人机初始位置较远时,初期朝向目标点飞行累积较高奖励,最终即使产生碰撞累积奖励和也会较大,这种情况下用累计奖励衡量算法性能的话是不是可能会有偏颇?
非常感谢大佬的解答。我在大佬的论文中看到,控制器的频率也做了限制,大小为10Hz,请问这个频率是什么意思啊?是要在UE4中去专门设置这个值吗?还是在控制代码里去设置啊?不同的频率设定会对算法训练的成功率产生较大的影响吗?辛苦大佬再解答一下
我目前没有还没有找到解决这个问题的方法,但我发现这个问题确实存在。clockspeed参数的设置会对Airsim中的物理参数造成影响,而并非单纯的加速仿真。例如设置clockspeed = 1,在这种情况下,设置一架UAV沿X轴以5m/s的速度运动,那么此时测试UAV的速度,发现确实是5m/s;但是,如果在clockspeed =5时设置一架UAV沿X轴以5m/s的速度运动,那么再去测试UAV的速度,会发现只有大约1m/s,也即5/5 = 1。(真实数据/时钟速度)。这也是为什么我说在ClockSpeed=5的设置下训练好的策略,无法成功的应用于ClockSpeed=1的测试中。 此外,也有其他人发现了这个问题,例如:[https://github.com/microsoft/AirSim/issues/4841](url) 还有一篇论文也提到了这个现象: [simul_2022_1_90_50041.pdf](https://github.com/heleidsn/UAV_Navigation_DRL_AirSim/files/14630540/simul_2022_1_90_50041.pdf)
嗯嗯,期待您的更新~~
请问你最终解决这个问题了吗?
Hello @araffin ,I'm curious, why use the following code to scale the action? `return 2.0 * ((action - low) / (high - low)) - 1.0` In particular, why multiply by...
I think I have understood the reason for the above approach. The above scaling method is based on the min-max normalization, and a linear change is made, so the range...
Hello, I also encountered a similar problem to you. My task is to use DRL to train the drone to avoid obstacles, with ClockSpeed set to 5. When I complete...
@Charles-Lim93 @LucasJSch Hello everyone, thank you for your replies. My current task is to use 3 drones to track 1 drone in the Block environment and achieve collision avoidance. The...