gjq718
gjq718
| | guojq718 | | [email protected] | 如果数据集够大就过拟合也没啥问题,特别小的数据集过拟合就很有问题,而且我发现连续特征也没有用上这个模型,但是换个数据集也能训练个几次才过拟合,不知道问题在哪 签名由网易邮箱大师定制 在2020年8月25日 22:58,举起手来 写道: 我的也是,感觉这库不行呀,动不动过拟合。。。。 — You are receiving this because you authored the thread. Reply to this email directly, view it...
你好,我有些问题,关于y=【1,0,1】 这个预测到底预测的是哪个项,我理解的是sess1的第一个列表全部都是用户0的历史交互数据,那y标签的是哪一个项?
谢谢,我还有疑惑,对于给的例子数据 uid ugender iid cateid ... sess2_iid sess2_cate_id sess_number y 0 0 1 1 ... [1, 2, 3, 0] [1, 2, 2, 0] 2 1 标红的1作为用户0标签,它标记的是用户点击那一项的概率,正常来说用户一次交互都有一个标签代表有没有点击,平常的数据集也没太见过这种类似方式的 如果我用自己的数据集比如Movieslens,那y那一列我该怎么写,因为movieslens都是用户交互一个项 有一个标签,比如交互200个项有200个标签,sessi之后那y那一列只能写一个数,那这时他标记预测的哪一项呢 期待您的解答,我困在这出不去了 |...
太谢谢你了,我看懂你的说明了。 对于session负样本的问题,session里应该是规定了只能是正样本,而且必须是正样本,因为session里相当于装的是你的兴趣偏好,这是你的依据,如果session里有负样本,这个负样本就相当于噪声,严重混淆你的判断,所以如果存在负样本的话应该剔除,只保留正样本,这是我的理解。 | | guojq718 | | [email protected] | 签名由网易邮箱大师定制 在2020年8月7日 10:20,laizef 写道: 谢谢,我还有疑惑,对于给的例子数据 uid ugender iid cateid ... sess2_iid sess2_cate_id sess_number y 0 0 1 1 ... [1, 2,...