VirtualTaobao 拟使用VirtualTaobao作为实验平台，寻求帮助

您好，我最近在做一个研究工作，准备以VirtualTaobao作为实验平台。但是发现一个问题，样例给的DDPG模型，在gamma=0.5、tau=0.003、hidden_size=128、记忆批次为32、迭代次数5000+的条件下，CTR趋于1。我使用基于DDPG改进的其他算法也是在优化之后趋于1。因此无法进行对比，我在想是不是因为数据集太小产生了过拟合？另外想请问一下，现在大数据集的模型完成了吗？能否共享大数据集模型？或者能否共享一下源码便于我训练其他数据集的模型？非常希望得到您的帮助。

Mar 14 '20 17:03 GuangyaoPang

我们正在准备新的模拟器，会有更好的效果。

Mar 21 '20 14:03 eyounx

我们正在准备新的模拟器，会有更好的效果。

非常期待新的模拟器，感谢贵团队的贡献，深度强化学习在推荐领域太缺乏模拟器了。

Mar 24 '20 05:03 GuangyaoPang

@GuangyaoPang 你好，请问一下推荐系统有强化学习开源的代码吗？我最近在研究强化学习在推荐系统的应用，希望得到一些帮助。期待你的回复。

May 12 '20 05:05 wkzqn

@eyounx 请问一下CTR趋于1代表啥呢？

May 12 '20 05:05 wkzqn

@GuangyaoPang 你好，请问一下推荐系统有强化学习开源的代码吗？我最近在研究强化学习在推荐系统的应用，希望得到一些帮助。期待你的回复。

使用深度强化学习做推荐当前还是比较少的，我看最新的论文也就淘宝、京东和谷歌有一些，例如https://github.com/luozachary/drl-rec 。我感觉从学术研究角度解决其中的某些问题是可行的，如果是想实际应用还是有存在很多问题。

May 20 '20 15:05 GuangyaoPang

您好，我最近在做一个研究工作，准备以VirtualTaobao作为实验平台。但是发现一个问题，样例给的DDPG模型，在gamma=0.5、tau=0.003、hidden_size=128、记忆批次为32、迭代次数5000+的条件下，CTR趋于1。我使用基于DDPG改进的其他算法也是在优化之后趋于1。因此无法进行对比，我在想是不是因为数据集太小产生了过拟合？另外想请问一下，现在大数据集的模型完成了吗？能否共享大数据集模型？或者能否共享一下源码便于我训练其他数据集的模型？非常希望得到您的帮助。

我没这个问题

Feb 26 '21 11:02 Fanshaoliu

我们正在准备新的模拟器，会有更好的效果。

于教授您好，首先非常感谢您们团队的共享和开源。对于您们这次开源的代码，我有一些问题想要请教一下，首先就是数据类型，你们是构建的所有的商品数据集是怎么构建的，也是进行one-hot编码吗？就是把价格，点击率，等等按照one-hot编码？，也我非常想知道您的数据集构建方式。第二就是你是怎么计算论文里面的tt,tv值的，还有你是怎么计算每个商品的销售量的？第三就是您开源的代码是否可以开源整个完整的代码呢？非常感谢！

Aug 01 '21 08:08 liupengcnu

VirtualTaobao VirtualTaobao copied to clipboard

拟使用VirtualTaobao作为实验平台，寻求帮助

VirtualTaobao
VirtualTaobao copied to clipboard