OpenKS
OpenKS copied to clipboard
请问如何更换自己的数据集
python -m examples.text_keyphrase
请问如何更换自己的数据集,我直接在后面加数据是不行的吗,还是需要标注或者关键词分数?
可以更换的,只要保证跟样例数据的格式一致就可以
必须每个都要标注过吗
不能直接在后面加吗,还有如果要做预测新样例,应该怎么调用。
不需要的,关键短语抽取这个任务,数据集只要跟 data/patent-text/train 这个文件中的格式一样就行,每一行是一篇专利的数据,格式为:标题@@摘要
valid文件好像不预测,出的都是train文件预测结果。