lwc6666

Results 1 issues of lwc6666

博主您好,我是一名在读研究生,十分有幸读到了您的这篇论文,想深入学习下去,在论文和实验中我遇到了一些困惑,尽力查阅了不少资料后还是不太明白,希望能够向您请教,感激不尽。 1.文中每个边缘节点的效用函数,都是所有边缘节点的服务比之和吗 ![image](https://github.com/neardws/Game-Theoretic-Deep-Reinforcement-Learning/assets/97877534/72e72fd2-379c-4817-b639-0bdede3b8e2a) 2.您的势函数是如何构造出来的,不太明白势函数的第二项Ue(-Se,S-e)的意思,和怎么计算的 ![image](https://github.com/neardws/Game-Theoretic-Deep-Reinforcement-Learning/assets/97877534/999b5030-e310-4dc9-9f07-2ec59ea4e176) 3.您在证明这个势函数的时候,最后一步是把Ue(-Se,S-e)和Ue(-Se‘,S-e)抵消了吗,有点不太明白怎么消去的 ![image](https://github.com/neardws/Game-Theoretic-Deep-Reinforcement-Learning/assets/97877534/2317883a-bd65-4bb0-b0d4-f108bef2ad11) 4.在跑您实验中的D4PG算法时,我得到的average_execution_times和average_service_times的值非常小, ![image](https://github.com/neardws/Game-Theoretic-Deep-Reinforcement-Learning/assets/97877534/9d564f17-ce95-4915-bc3b-8d80bb264d28) 使用是默认的global数据,和文中的结果不太符合,文中的D4pg,APT和AST的值看起来是7和10左右。其余的算法都符合您图中的数值,没有找到问题是出现在哪里了。 5.关于势博弈您有一些资料推荐吗,看了原文感觉读起来有些吃力。。 希望博主能在闲暇之余给予一些指导,非常感激您