shouldsee comments

Results 48 comments of


shouldsee

版本 67fa2e3 可以尝试一下`cut_all=True` ```python3 #-*- coding:utf8 -*- import jieba for sent in "机动战士高达地心历险记".split(): for cut_all in [True,False]: x = seg_list = jieba.cut(sent, cut_all=cut_all) x = list(x) print('cut_all=%s'%cut_all) print(x) ```...

Paddle模式下，执行大量次数分词时程序卡住

`floating point exception` 看起来像是哪里的数值问题

取消星星了，这个项目已经死了

感谢建议 @theblackcat102 onnx 很有意义,现在的梯度模型要上gpu上集群都是有需求的权重和字典分离具体指什么? spacy下载实际上也有挺多的版本控制的问题,字典现在下载速度是真的很慢是吗? DAG不改的话具体有什么问题可以展开一下吗?

取消星星了，这个项目已经死了

权重写死到PY文件肯定是有问题的,那最简修改的话至少要引入一个模型文件名,作为模型的属性加以维护应该是不难的,只要在模型初始化的时候指定即可,可选地可以支持简单http或者https的url直接读取简单的response直接load到模型里. 可以先把这部分简单改出来,然后看看具体文件格式怎么adapt 可读性的话,大家加注释comment就好了?那现在的问题主要还是没有一个active的review/maintain routine? 得有人花时间维护一套repo branch应该就可以? 目标就是把issue区清干净:D

取消星星了，这个项目已经死了

要开始维护的话,至少得先确定测试目标,和测试环境,还有api语法. 目前看来能跑的测试就只有`test/jieba_test.py`了,然后文档也得把函数签名写清楚一点... - 测试环境: python2.7 python3.5 python3.7 ? - 测试目标: test/jieba_test.py 通过, 重要issue加入testcase - 文档完善: - 加了个fork(https://github.com/shouldsee/jieba) 尝试写sphinx文档中: https://shouldsee.github.io/jieba/ 1. [x] 分词[doc](https://shouldsee.github.io/jieba/func-token.html#id2) 2. [ ] 添加自定义词典 [doc](https://shouldsee.github.io/jieba/func-token.html#id2) 3. [ ]...

[blocked] github.repos.archive() & octokit.repos.uploadAsset() not working in browser due to CORS settings on codeload.github.com & uploads.github.com

is this a CORS problem? https://medium.com/netscape/hacking-it-out-when-cors-wont-let-you-be-great-35f6206cc646

还在持续更新吗？

@cycleuser 为啥会和谐?是没版权嘛?

还在持续更新吗？

:X.好吧,是受疫情影响嘛?...

shouldsee

添加自定义辞典后，英文切分出现问题

在词典中的词被切成了单字

在词典中的词被切成了单字

Paddle模式下，执行大量次数分词时程序卡住

取消星星了，这个项目已经死了

取消星星了，这个项目已经死了

取消星星了，这个项目已经死了

[blocked] github.repos.archive() & octokit.repos.uploadAsset() not working in browser due to CORS settings on codeload.github.com & uploads.github.com

还在持续更新吗？

还在持续更新吗？