andersc

Results 15 comments of andersc

@toplevmas 这个问题在Python版的jieba里也存在,我曾经想修改,没有完成。下面有时间看看。

@toplevmas 我想了想,这个问题不是那么简单的。如果我们把“Steve Jobs”作为一个词来看,那么会导致另一个问题,即Steve和Jobs这两个词就分不出来了。在精确模式下这个还可以接受,但在搜索引擎模式会有问题,除非我们把Steve和Jobs也加入词典,但这个不现实。 另一个思路是,先按照现有方式分词,然后尝试进行merge,你觉得怎么样?

@HALOCORE 能否提供一段示例代码,我需要参考一下在UWP中如何正确地使用文件路径:)

@davidqing2000 你希望的是什么效果的提取摘要函数,说一个已有的库?

嗯,这个好像是有问题的,我后面看看源码。谢谢你的issue。 On 13 August 2018 at 14:51, gzcqy wrote: > JiebaNet.Segmenter.WordDictionary.Instance.DeleteWord("北京"); > JiebaNet.Segmenter.WordDictionary.Instance.DeleteWord("北京市"); > JiebaNet.Segmenter.WordDictionary.Instance.DeleteWord("海淀区"); > > JiebaNet.Segmenter.WordDictionary.Instance.AddWord("北京", 6000, "city"); > JiebaNet.Segmenter.WordDictionary.Instance.AddWord("北京市", 6000, "city"); > JiebaNet.Segmenter.WordDictionary.Instance.AddWord("海淀区", 6000, "town"); > //seg.LoadUserDict(AppDomain.CurrentDomain.SetupInformation.ApplicationBase...

@kingwa5 自定义词典这里,我用你的代码测下来是正常的,没有重现。 另外,你说的是哪个例子看不出区别?

@gideon0709 非常感谢您的建议,您是否可以添加一个pull request,如果不方便,我下一次再加上。

目前 jieba 是以中文字符来分割字符串的,因此除了字典,代码上也要做一点修改。 On Mon, 23 Nov 2020 at 11:30, Winson wrote: > 如果我创建一个日文和韩文的字典,是否就可以同时支持这2种语言呢? > > — > You are receiving this because you are subscribed to this thread. >...