VirtualTaobao
VirtualTaobao copied to clipboard
拟使用VirtualTaobao作为实验平台,寻求帮助
您好,我最近在做一个研究工作,准备以VirtualTaobao作为实验平台。但是发现一个问题,样例给的DDPG模型,在gamma=0.5、tau=0.003、hidden_size=128、记忆批次为32、迭代次数5000+的条件下,CTR趋于1。我使用基于DDPG改进的其他算法也是在优化之后趋于1。因此无法进行对比,我在想是不是因为数据集太小产生了过拟合?另外想请问一下,现在大数据集的模型完成了吗?能否共享大数据集模型?或者能否共享一下源码便于我训练其他数据集的模型?非常希望得到您的帮助。
我们正在准备新的模拟器,会有更好的效果。
我们正在准备新的模拟器,会有更好的效果。
非常期待新的模拟器,感谢贵团队的贡献,深度强化学习在推荐领域太缺乏模拟器了。
@GuangyaoPang 你好,请问一下推荐系统有强化学习开源的代码吗?我最近在研究强化学习在推荐系统的应用,希望得到一些帮助。期待你的回复。
@eyounx 请问一下CTR趋于1代表啥呢?
@GuangyaoPang 你好,请问一下推荐系统有强化学习开源的代码吗?我最近在研究强化学习在推荐系统的应用,希望得到一些帮助。期待你的回复。
使用深度强化学习做推荐当前还是比较少的,我看最新的论文也就淘宝、京东和谷歌有一些,例如https://github.com/luozachary/drl-rec 。我感觉从学术研究角度解决其中的某些问题是可行的,如果是想实际应用还是有存在很多问题。
您好,我最近在做一个研究工作,准备以VirtualTaobao作为实验平台。但是发现一个问题,样例给的DDPG模型,在gamma=0.5、tau=0.003、hidden_size=128、记忆批次为32、迭代次数5000+的条件下,CTR趋于1。我使用基于DDPG改进的其他算法也是在优化之后趋于1。因此无法进行对比,我在想是不是因为数据集太小产生了过拟合?另外想请问一下,现在大数据集的模型完成了吗?能否共享大数据集模型?或者能否共享一下源码便于我训练其他数据集的模型?非常希望得到您的帮助。
我没这个问题
我们正在准备新的模拟器,会有更好的效果。
于教授您好,首先非常感谢您们团队的共享和开源。对于您们这次开源的代码,我有一些问题想要请教一下,首先就是数据类型,你们是构建的所有的商品数据集是怎么构建的,也是进行one-hot编码吗?就是把价格,点击率,等等按照one-hot编码?,也我非常想知道您的数据集构建方式。第二就是你是怎么计算论文里面的tt,tv值的,还有你是怎么计算每个商品的销售量的?第三就是您开源的代码是否可以开源整个完整的代码呢?非常感谢!