jieba-php icon indicating copy to clipboard operation
jieba-php copied to clipboard

这个有词频分析和数据输出么?

Open wolf8210137 opened this issue 6 years ago • 3 comments

我想要在一个句子中,取出前3个使用频率最高的名词,或者说最重要的前三个词。单纯的分词实现不了。不知道jieba-php有分词功能么?

wolf8210137 avatar Apr 26 '18 07:04 wolf8210137

@wolf8210137 有關鍵詞提取功能,使用 TF/IDF 演算法,請見 Readme 功能 3):關鍵詞提取

fukuball avatar Apr 26 '18 08:04 fukuball

cut可以加一个返回完整的分词带idf和词性的数组的选项吗, 返回结果类似这样 array(21) { [0]=> array(2) { ["word"]=> string(3) "这" ["idf"]=> double(8) 1.22223333 ["tag"]=> string(1) "r" }.... } 用google的simhash算法做文章的相似度比较,需要文章的全部分词的权重,同时做情感分析需要分词的词性 也就是说,在cut的返回结果里把idf和词性也都带上就好了@fukuball

kency avatar May 23 '18 22:05 kency

是可以花時間加上這樣的功能,看有沒有人要幫忙,或是等我有空 XD

fukuball avatar Sep 10 '18 06:09 fukuball