paraphraser icon indicating copy to clipboard operation
paraphraser copied to clipboard

Paraphrase Chinese sentences

基于哈工大同义词词林的同义句生成器和归一器

paraphase.py 先将句子分词,然后逐个词语在词林中搜索,若搜到多个同义词,则先判断是否词性相同,若还是有多个同义词,则选出最常用的一个意义,替换此一行的全部词语。

unify.py 先将句子分词,然后逐个词语在词林中搜索,若搜索到多个同义词,则先判断是否词性相同,若还是有多个同义词,则选出最常用的一个意义,替换为此一行的词根。

synonym.py 读取及预处理同义词词林函数,句子分词及标注词性函数

  • \data
    • 五个句子.xlsx 用于替换的五个句子
  • \dictionary
    • \Cilin.txt 哈工大同义词林,无分类符号
    • \synonym.txt 哈工大同义词林,带分类符号
  • \output
    • \output.txt 同义句生成输出
    • \unify_output.txt 归一化句子输出# paraphrase