tensorflow-DeepFM icon indicating copy to clipboard operation
tensorflow-DeepFM copied to clipboard

请问有在criteo数据集测试过性能吗?

Open anzhizh opened this issue 6 years ago • 6 comments

anzhizh avatar Oct 14 '18 20:10 anzhizh

我把criteo连续特征离散化(等频离散化成500份)后当成类别特征,所有的类别特征过滤出现少于50次的,dropout都为0.7,DNN为[400,400,400], auc为0.8097左右,然而单纯的DNN都到0.8105了。我自己实现的DeepFM也类似,不知道是什么原因

huaileiseu avatar Dec 16 '18 05:12 huaileiseu

我把criteo连续特征离散化(等频离散化成500份)后当成类别特征,所有的类别特征过滤出现少于50次的,dropout都为0.7,DNN为[400,400,400], auc为0.8097左右,然而单纯的DNN都到0.8105了。我自己实现的DeepFM也类似,不知道是什么原因

请问你用的criteo是多少数据量,大概要多少内存?

sunjiaxin111 avatar Feb 28 '19 08:02 sunjiaxin111

@huaileiseu

sunjiaxin111 avatar Feb 28 '19 08:02 sunjiaxin111

是用的4千万多数据测试的还是?

LindseyScharpman avatar Dec 02 '19 04:12 LindseyScharpman

我把criteo连续特征离散化(等频离散化成500份)后当成类别特征,所有的类别特征过滤出现少于50次的,dropout都为0.7,DNN为[400,400,400], auc为0.8097左右,然而单纯的DNN都到0.8105了。我自己实现的DeepFM也类似,不知道是什么原因

请问你用的criteo是多少数据量,大概要多少内存?

30g吧差不多

huaileiseu avatar Dec 11 '19 12:12 huaileiseu

是用的4千万多数据测试的还是?

是的

huaileiseu avatar Dec 11 '19 12:12 huaileiseu