VirtualTaobao icon indicating copy to clipboard operation
VirtualTaobao copied to clipboard

拟使用VirtualTaobao作为实验平台,寻求帮助

Open GuangyaoPang opened this issue 4 years ago • 7 comments

您好,我最近在做一个研究工作,准备以VirtualTaobao作为实验平台。但是发现一个问题,样例给的DDPG模型,在gamma=0.5、tau=0.003、hidden_size=128、记忆批次为32、迭代次数5000+的条件下,CTR趋于1。我使用基于DDPG改进的其他算法也是在优化之后趋于1。因此无法进行对比,我在想是不是因为数据集太小产生了过拟合?另外想请问一下,现在大数据集的模型完成了吗?能否共享大数据集模型?或者能否共享一下源码便于我训练其他数据集的模型?非常希望得到您的帮助。

GuangyaoPang avatar Mar 14 '20 17:03 GuangyaoPang

我们正在准备新的模拟器,会有更好的效果。

eyounx avatar Mar 21 '20 14:03 eyounx

我们正在准备新的模拟器,会有更好的效果。

非常期待新的模拟器,感谢贵团队的贡献,深度强化学习在推荐领域太缺乏模拟器了。

GuangyaoPang avatar Mar 24 '20 05:03 GuangyaoPang

@GuangyaoPang 你好,请问一下推荐系统有强化学习开源的代码吗?我最近在研究强化学习在推荐系统的应用,希望得到一些帮助。期待你的回复。

wkzqn avatar May 12 '20 05:05 wkzqn

@eyounx 请问一下CTR趋于1代表啥呢?

wkzqn avatar May 12 '20 05:05 wkzqn

@GuangyaoPang 你好,请问一下推荐系统有强化学习开源的代码吗?我最近在研究强化学习在推荐系统的应用,希望得到一些帮助。期待你的回复。

使用深度强化学习做推荐当前还是比较少的,我看最新的论文也就淘宝、京东和谷歌有一些,例如https://github.com/luozachary/drl-rec 。我感觉从学术研究角度解决其中的某些问题是可行的,如果是想实际应用还是有存在很多问题。

GuangyaoPang avatar May 20 '20 15:05 GuangyaoPang

您好,我最近在做一个研究工作,准备以VirtualTaobao作为实验平台。但是发现一个问题,样例给的DDPG模型,在gamma=0.5、tau=0.003、hidden_size=128、记忆批次为32、迭代次数5000+的条件下,CTR趋于1。我使用基于DDPG改进的其他算法也是在优化之后趋于1。因此无法进行对比,我在想是不是因为数据集太小产生了过拟合?另外想请问一下,现在大数据集的模型完成了吗?能否共享大数据集模型?或者能否共享一下源码便于我训练其他数据集的模型?非常希望得到您的帮助。

我没这个问题

Fanshaoliu avatar Feb 26 '21 11:02 Fanshaoliu

我们正在准备新的模拟器,会有更好的效果。

于教授您好,首先非常感谢您们团队的共享和开源。对于您们这次开源的代码,我有一些问题想要请教一下,首先就是数据类型,你们是构建的所有的商品数据集是怎么构建的,也是进行one-hot编码吗?就是把价格,点击率,等等按照one-hot编码?,也我非常想知道您的数据集构建方式。第二就是你是怎么计算论文里面的tt,tv值的,还有你是怎么计算每个商品的销售量的?第三就是您开源的代码是否可以开源整个完整的代码呢?非常感谢!

liupengcnu avatar Aug 01 '21 08:08 liupengcnu