jieba.NET icon indicating copy to clipboard operation
jieba.NET copied to clipboard

TfidfExtractor.SetStopWords似乎沒有作用

Open gideon0709 opened this issue 8 years ago • 3 comments

您好,首先很感謝您提供的程式 我使用TfidfExtractor去截取關鍵詞時 原程式可以將stopwords.txt裡面的關鍵詞剃除掉 例如新增 "穿搭"關鍵詞,則不會出現這兩個字 但我想要動態新增關鍵詞 於是使用了 SetStopWords 例如 Dim aa = New TfidfExtractor aa.SetStopWords("穿搭") Dim bb = aa.ExtractTags(articleContent, FormatNumber(50))

但似乎沒有作用 程式還是會把"穿搭"兩個字當作關鍵詞列出來 這能否修改一下呢? 謝謝您

gideon0709 avatar Dec 12 '16 08:12 gideon0709

SORRY...我發現SetStopWords是設定停用字詞的文字檔路徑 不是拿來使用類似動態新增字詞的功能

可否也新增一個功能是動態新增停用字詞呢? (類似JiebaSegmenter.AddWord) 謝謝

gideon0709 avatar Dec 12 '16 08:12 gideon0709

public void AddStopWords(string Word) { if (!StopWords.Contains(Word)) { StopWords.Add(Word.Trim()); } }

您好,我自己解決了,加了一個函數 但不知道如何更新GitHub上 若您覺得可以使用,就請您再更新囉 謝謝

gideon0709 avatar Dec 12 '16 09:12 gideon0709

@gideon0709 非常感谢您的建议,您是否可以添加一个pull request,如果不方便,我下一次再加上。

anderscui avatar Dec 14 '16 06:12 anderscui