PaddleRec
PaddleRec copied to clipboard
缺少reader.py
https://github.com/PaddlePaddle/PaddleRec/blob/release/2.1.0/datasets/ali-ccp/data_process.sh
缺少reader.py
echo "preprocessing data......"
python reader.py --train_data_path ${train_target_path} \
--test_data_path ${test_target_path} \
--vocab_path vocab/vocab_size.txt \
--train_sample_size 6400 \
--test_sample_size 6400 \
https://github.com/PaddlePaddle/models/pull/4531 原始处理可以参考这个pr
不是很明白,请问reader.py对应哪个文件
PaddleRec/multi-task/ESMM/reader.py 这个pr中的
@frankwhzhang 上述PR似乎 只保留 feature_filed: feature_id, 而具体特征的取值去除了
@frankwhzhang 上述PR似乎 只保留 feature_filed: feature_id, 而具体特征的取值去除了
同疑问