Alex Wang

Results 5 comments of Alex Wang

很好的想法,尤其是管道的使用。 此外,想补充一些,关于tr这块,是否可以参考python的textrank4zh包,可以整合到R里,提供文本关键句、关键短语和关键词的抽取。 这么建议,主要是想除了细粒度的分词结果外,是否可以考虑提供较粗颗粒度的切割结果, 因为有感觉后者在大量文本,尤其是短文本的分析任务,比如主题抽取和聚类中,用于获取文本特征, 较之细粒度的词,可能会有更理想的表现。 2016-11-18 11:13 GMT+08:00 qinwf [email protected]: > 重新规划新的 API,让大家用起来方便一些。下面是一些想法: > > 1、分离 Cppjieba 中的分词,关键词提取,Simhash 的方法为小的模块,不相互依赖。Cppjieba 5.0 增加了 Textrank > 的模块,现有的接口想把这个模块整合起来,使用起来感觉可能会不方便。 > > 在原有的 Cppjieba 的代码中,关键词提取和Simhash 的步骤是包含了分词步骤的,而这两个步骤其实可以独立出来,...

On schedule On Sat, 22 Jun 2019 at 21:33, justao wrote: > refer to the original tensorflow implemention > > > — > You are receiving this because you are...

I also met the segmentation fault these days. I use the monotonic1 dataset and it happens each time I run the program. The code is attached. You may have a...

Try `jieba.dt.FREQ` On Feb 24, 2018 17:55, "xunyl" wrote: if w in jieba.FREQ: d[w]=d.get(w,0.0) + 1.0 jieba.FREQ现在已经不存在了,请问现在应该如何写if w in ? — You are receiving this because you are subscribed to...

So you may use codegpt with custom openapi service + ollama template. It's easy to configure.