Andy Sun

Results 35 comments of Andy Sun

@imotai , 只在SDK端拦了一下,应该还是有漏洞的。

@247687009 , 暂时没有实现Java SDK、 InsSDK里面有很多逻辑,如果要支持Java,需要把这部分逻辑也用Java重写一下。

@imotai , 赞! 好久不见

这个可以有

嗯,这部分我还没实现,目前membership是在配置里面写入的,无法动态增减。

https://github.com/baidu/galaxy/pull/310

@xuqiang , 目前没有。你可以先看看代码,100行左右。 就是修改了viterbi算法中的状态到字符的发射概率的计算方法,把它改为用NB去估计,估计的时候考虑了了当前字符周围的字符。 训练程序:https://github.com/fxsjy/miniseg/blob/master/train/train_bayes_model.py 分词程序:https://github.com/fxsjy/miniseg/blob/master/miniseg/__init__.py

@argan , github上面放的是msr语料,网上可以下载到:http://www.cnblogs.com/zhangchaoyang/articles/2571110.html 我那个demo网站用了更多的语料:1)SIGHAN比赛中的语料,在数据堂可以下载到; 2)我自己用“结巴分词”切割新闻文本后形成的语料。