Jeff

Results 3 comments of Jeff

但tf-idf.ipynb中并没有生成data.pk的代码,这个文件也无法用notepad++打开。 请问data.pk的内容和格式是怎样的?

好的。谢谢! 那么all_dick,idf_dict这两个data.pk文件读取得到的变量,打印出来的模式分别是【分词:序号】,【分词:IDF值】。这样理解对吗

我的理解是,文中这句话出现了超过三次。而在计算后这句话的三次分数特别高,因此会重复出现在摘要汇总。 原来的代码没有去重功能,可以自己加一个