lwc6666 issues

Results 1 issues of


                                            lwc6666

请求论文和实验的一些疑惑解答

博主您好，我是一名在读研究生，十分有幸读到了您的这篇论文，想深入学习下去，在论文和实验中我遇到了一些困惑，尽力查阅了不少资料后还是不太明白，希望能够向您请教，感激不尽。 1.文中每个边缘节点的效用函数，都是所有边缘节点的服务比之和吗 ![image](https://github.com/neardws/Game-Theoretic-Deep-Reinforcement-Learning/assets/97877534/72e72fd2-379c-4817-b639-0bdede3b8e2a) 2.您的势函数是如何构造出来的，不太明白势函数的第二项Ue（-Se，S-e）的意思，和怎么计算的 ![image](https://github.com/neardws/Game-Theoretic-Deep-Reinforcement-Learning/assets/97877534/999b5030-e310-4dc9-9f07-2ec59ea4e176) 3.您在证明这个势函数的时候，最后一步是把Ue（-Se，S-e）和Ue（-Se‘，S-e）抵消了吗，有点不太明白怎么消去的 ![image](https://github.com/neardws/Game-Theoretic-Deep-Reinforcement-Learning/assets/97877534/2317883a-bd65-4bb0-b0d4-f108bef2ad11) 4.在跑您实验中的D4PG算法时，我得到的average_execution_times和average_service_times的值非常小， ![image](https://github.com/neardws/Game-Theoretic-Deep-Reinforcement-Learning/assets/97877534/9d564f17-ce95-4915-bc3b-8d80bb264d28) 使用是默认的global数据，和文中的结果不太符合，文中的D4pg，APT和AST的值看起来是7和10左右。其余的算法都符合您图中的数值，没有找到问题是出现在哪里了。 5.关于势博弈您有一些资料推荐吗，看了原文感觉读起来有些吃力。。希望博主能在闲暇之余给予一些指导，非常感激您