JeremyLiang
JeremyLiang
> @jexterliangsufe 您指的哪部分数据?如果是应用的话,直接使用您自己的数据,我也是用于自己的项目中的,所以只提供了一个测试样例,在test下面。如果是指其他的数据文件(四角编码、笔画数等)已经在代码里有了 感谢回复!我指的是您的汉字-结构以及汉字-笔画的映射数据是怎么收集的呢?
> @jexterliangsufe 在网上找的哈哈~源地址不记得了,应该也能搜到很多版本 多谢多谢!
Hi, deepctr_torch可以利用pytorch库里的IterableDataset来构建流式的数据输入,然后构造DataLoader。 目前deepctr_torch.models.basemodel不支持DataLoader的输入,但是可以看一下deepctr_torch.models.basemodel.fit的代码,模型训练时候依然是将输入转为DataLoader再训练的,所以可以修改一下源码,直接将DataLoader作为fit的输入,就可以避免内存错误的问题了。 Hi, you can use torch.utils.data.IterableDataset to construct flow dataset and use torch.utils.data.DataLoader to construct the model input. DataLoader is not supported in the newest version of deepctr_torch.models.basemodel....
因为FM层的输入维度是N * P * H,N是batch_size,P是离散特征个数(也可以说是SparseFeature),H是embedding的维度,而你输入FM层的数据维度的H不是固定的,不同的特征采用了不同的H,所以会报错,我也遇到了这个问题,目前的解决方法是把所有SparseFeature的embedding维度设置成一样的,不知道现在你有没有更好的解决方法呢? FM layer's inout dimension is N * P * H. N represents the batch size, P is the number of sparse feautures and H is...
I have the same question. > .