lambdaji

Results 26 comments of lambdaji

参考DeepMTL/feature_pipline

原始文件 -----> libsvm ----> tfrecords 用什么工具跑不重要,sh+hadoop就是为了把原始数据转成libsvm数据格式(40362692,0,0,216:9342395:1.0 301:9351665:1.0 205:7702673:1.0 206:8317829:1.0 207:8967741:1.0 508:9356012:2.30259),然后get_tfrecords.py再把libsvm转成tfrecord

参考一下DIN的代码:Feature_pipeline/get_aliccp_tfrecord.py & Model_pipeline/DIN.py 暂时没调出效果,先放出来吧,欢迎一起DEBUG

> 这个field_size盯死的问题,现在有解决方案嘛 在NN里面filed_size一般是固定的,feature_size可以不固定,可能存在多值filed;多值特征的问题可以通过padding+mask解决,Model_pipeline/DIN.py里面有一个例子