请问在实现 Actor-Critic算法的时候，有过将网络层共享的案例嘛

Open A5230171 opened this issue 3 years ago • 2 comments

我提问的是，Actor 需要输入状态state，Critic 需要输入状态state，动作 action。那么是否可以 Actor 模型和 Critic 模型共享网络（状态state 特征提取）呢？

Jul 04 '22 06:07 A5230171

目前还没有呢，我们补充一个，感谢你的反馈：）

Jul 04 '22 11:07 TomorrowIsAnOtherDay

我最近有根据，PARL/examplex/DDPG的程式范例，也是使用mujoco一样的环境。

结合这篇论文《Integrated Actor-Critic for Deep Reinforcement Learning》的设计思想（链接https://par.nsf.gov/servlets/purl/10333252）进行试验，但是貌似实验，失败了哈哈哈！

才想问问看！

Jul 04 '22 15:07 A5230171

请问在实现 Actor-Critic算法的时候，有过将 网络层 共享的案例嘛