NLP icon indicating copy to clipboard operation
NLP copied to clipboard

natural language processing

NLP

NLP

主要实现以下几个算法,以分词为任务,语料库为标准语料库PKU,MSR

1 朴素贝叶斯

2 最大匹配 中文分词

3 N-gram模型

4 隐马尔科夫模型

5 隐马尔科夫(最大似然估计)中文分词

6 最大熵马尔科夫模型

7 W条件随机场 中文分词

WCRF在msr上分词F1值达95.7%


NLP/WCRF

8 文档相似性