Jiagu icon indicating copy to clipboard operation
Jiagu copied to clipboard

文本摘要以句号结尾定义句子粒度

Open xiaoshuwen1995 opened this issue 4 years ago • 0 comments

在使用其他NLP工具来提取文本摘要时,通常是一个逗号认为一个句子。

而我在使用jiagu提取摘要时,注意到一个明显的差异:jiagu以句号认为是句子。

请问这样设置是有怎样的考量?谢谢

例如jiagu.summarize(text, 3)的结果如下: ['”NASA文章介绍,在中国为全球绿化进程做出的贡献中,有42%来源于植树造林工程,对于减少土壤侵蚀、空气污染与气候变化发挥了作用。', '该研究主持者之一、波士顿大学地球与环境科学系博士陈池(音)表示,“尽管中国和印度国土面积仅占全球陆地的9%,但两国为这一绿化过程贡献超过三分之一。', '其中,天然林资源保护工程完成造林26万公顷,退耕还林工程完成造林91.2万公顷。']

xiaoshuwen1995 avatar May 15 '20 09:05 xiaoshuwen1995