dingkun-ldk
dingkun-ldk
这个文件夹下面存放的是经过数据预处理的训练数据 请阅读readme里面的Data preprocess步骤,电商数据训练可以参考下面的流程 - mkdir ../data/ecom/train - python create_train.py --qrels_file ../data/ecom/qrels.train.tsv --query_file ../data/ecom/train.query.txt --collection_file ../data/ecom/corpus.tsv --save_to ../data/ecom/train/train.json --tokenizer_name bert-base-chinese - sh run_train.sh
代码更新在新的仓库里面了 https://github.com/AlibabaResearch/HLATR
The code now is available at https://github.com/AlibabaResearch/HLATR