tf_repos icon indicating copy to clipboard operation
tf_repos copied to clipboard

数据集用户id、商品id等cutoff问题

Open shuDaoNan9 opened this issue 4 years ago • 1 comments

运行DCN模型跑下面这个数据集时候有些疑问: http://labs.criteo.com/2014/02/download-kaggle-display-advertising-challenge-dataset/ Kaggle Display Advertising Challenge Dataset 我看里面数据格式是: The columns are tab separeted with the following schema:

谢谢!

shuDaoNan9 avatar Dec 06 '19 10:12 shuDaoNan9

切断是为了控制ids类特征做embedding的长度, 让长尾的ID都索引到0的位置,如果你知道怎么用参数服务器处理大规模稀疏ID特征,也可以所以的都加入训练

Ethan199111 avatar Mar 23 '20 06:03 Ethan199111