OpenKS icon indicating copy to clipboard operation
OpenKS copied to clipboard

请问如何更换自己的数据集

Open captain2017 opened this issue 3 years ago • 5 comments

python -m examples.text_keyphrase 请问如何更换自己的数据集,我直接在后面加数据是不行的吗,还是需要标注或者关键词分数? image

image

captain2017 avatar Jul 30 '21 02:07 captain2017

可以更换的,只要保证跟样例数据的格式一致就可以

changzong avatar Aug 02 '21 01:08 changzong

必须每个都要标注过吗

captain2017 avatar Aug 02 '21 01:08 captain2017

不能直接在后面加吗,还有如果要做预测新样例,应该怎么调用。

captain2017 avatar Aug 02 '21 01:08 captain2017

不需要的,关键短语抽取这个任务,数据集只要跟 data/patent-text/train 这个文件中的格式一样就行,每一行是一篇专利的数据,格式为:标题@@摘要

changzong avatar Aug 02 '21 01:08 changzong

valid文件好像不预测,出的都是train文件预测结果。

captain2017 avatar Aug 02 '21 08:08 captain2017