tf_repos
tf_repos copied to clipboard
TensorFlow Script
1. 请问DCN模型的代码不能直接用于criteo数据集吗?还是要运行的时候传哪几个参数? 2. 我看代码里面默认field_size是0,这里必须要在运行时候传参吧,比如我的是field_size=2496 ?不传参的话“ feat_vals = tf.reshape(feat_vals, shape=[-1, field_size, 1])”这里reshape成(-1,0)就报错了: Reshape cannot infer unless all specified input sizes are non-zero。 但是传参的话,后面feature_size代码里面默认也是0,且没有计算新值赋值,导致变成Feat_Emb维度是(0, 32),然后又引起 embeddings = tf.nn.embedding_lookup(Feat_Emb, feat_ids) # None *...
建议可以加个readme 比如get_criteo_feature.py默认测试集的所有特征都在训练集出现过,否则feature_map不全; 比如测试的数据不能太少,不然cutoff都没了; 比如测试集这里跟训练集这里下标差一:val = dists.gen(i, features[continous_features[i] - 1]),然后我改成跟训练集一样的下标了,应该是我的数据格式测试集合训练集是一样的,博主的两者数据坐标差一? 测试集的label = features[0]我也加上去了,这样后面对比测试效果应该能更加方便对比,不然延用训练集的最后一个label感觉怪怪的; 比如数值型连续值不能只有一个唯一值,否则归一化出错; ...........
As the title, i can't find the license in the repo
https://github.com/lambdaji/tf_repos/tree/master/deep_ctr#how-to-use should update the link -> 实验数据集用criteo,特征工程参考[here](url)
你好,我看了你的代码,感觉并没有对IPNN做的product做分解是么?还是我的理解有问题?谢谢
这个路径下有一堆特征处理脚本,特别乱,看的头都大了,请问这些脚本的具体执行顺序是怎么样的?get_join_sample.sh得到的是特征频次没过滤的libsvm格式,要得到最终的特征频次过滤后的libsvm格式,这些脚本应该按什么顺序执行?
有个疑问,请问特征109_14和特征206上的ID为啥是不统一的,理论上如果是同一个商品类目,ID不应该是一致的吗,我统计了其中40W条数据,发现这两个特征里出现的ID并没有交集,请问是我理解错了这个数据集的含义吗,有人可以解答吗,感谢!
遇到 UserWarning: Converting sparse IndexedSlices to a dense Tensor of unknown shape. This may consume a large amount of memory. "Converting sparse IndexedSlices to a dense Tensor of unknown shape....
请问阿里ccp数据集 你是否做了下采样 我过滤掉非法数据 还有近三千万行数据 压缩成gz也有30多g