DeepCTR icon indicating copy to clipboard operation
DeepCTR copied to clipboard

deepfm中二次项中没有看到处理连续性变量的地方

Open whk6688 opened this issue 3 years ago • 9 comments

image

如上截图,按照公式应该是embedding乘以对应的value(离散对应为1,但是连续性不是) 请解惑,谢谢

whk6688 avatar May 31 '21 12:05 whk6688

在实践中对连续变量离散化后进行embedding更常用,所以从v0.5.0及后续版本中移除了对连续特征进行embedding进行交互的功能。 如果希望使用这样的功能,可以使用v0.4.1版本。

shenweichen avatar May 31 '21 13:05 shenweichen

谢谢您的答复,但是从deepfm的代码中没有看到“对连续变量离散化”的操作,只看到了 拼接的操作 linear_logit = Linear(l2_reg, mode=2, use_bias=use_bias, seed=seed)([sparse_input, dense_input])和 dense_dnn_input = Flatten()(concat_func(dense_value_list)) 是我忽视了什么吗 谢谢

whk6688 avatar Jun 02 '21 13:06 whk6688

在特征处理阶段进行的,你在跟下代码看看

shenweichen avatar Jun 02 '21 13:06 shenweichen

我代码里没有特征处理,是否是我用错了 辛苦您 image

whk6688 avatar Jun 03 '21 02:06 whk6688

在v0.5.0以前的版本,你看下完整的源码

shenweichen avatar Jun 03 '21 03:06 shenweichen

但是我现在依然用的是0.8.3,我想知道在此版本是否需要 我们自己单独另外“对连续变量离散化”, 因为在此版本源代码我没有找到相关的操作。感激!

whk6688 avatar Jun 03 '21 03:06 whk6688

需要

shenweichen avatar Jun 03 '21 03:06 shenweichen

如果我退回到0.4.1的话 现在已经是0.8.*, 期间是否对deepfm或者wdl(只是这两种算法)有其他的优化或者bug修复,也就是说担心0.4.1的deepfm或者wdl有bug,有点矛盾。如果期间只是代码的重构或者优化其他的算法 我可以退回。

whk6688 avatar Jun 03 '21 03:06 whk6688

官网有每个版本的更新日志,你可以自己看下

shenweichen avatar Jun 03 '21 03:06 shenweichen