Wei Xu

Results 9 issues of Wei Xu

https://github.com/flask-dashboard/Flask-MonitoringDashboard/blob/73586c4aae2ce3cf9052c0915613157db56e43a2/flask_monitoringdashboard/templates/fmd_base.html#L70 this link can't be loaded. I try to change to link from `https://cdnjs.com/libraries/angular-route/1.7.5`, it works. maybe we just change to this one?

Hi, I came across a bug when use `longest_match` as `README.rst` introductions to do greedy search for the longest matching keywords. the `longest_match` did as README, ```Python def _longest_match(matches): spos_groupby_iter...

或许是因为找工作的原因,或者是在数据、模型、任务的繁多设置之间迷了方向,现在回过头看自己之前做的分词实验,觉得非常失败。 首先是很多信息没有记录全,导致现在回头看根本不知道到底是怎么做的了。 其次,数据结果太冗余。表现在两点,一是把prf、acc全给记录下来了。详细信息当然得保存下来,但是不应该展示在这里。二是为了做实验而做实验。我觉得在模型比较阶段,测试在开发集的效果就可以了——因为之前的实验也已经说明,开发集和测试集分布很一致;此外,没不要再做单独的PKU, WEIBO效果测试,那对当前模型选择意义不大(或许在之后是有意义的)。 最后,缺乏总结。一是没有对预测结果做查看(没有看错例!),二是没有对当前模型做深入评价,三是没有对未来工作做预期。导致的后果就是,做完该做的实验后,不知道模型哪里不好,说不出错误case,也不知道下步该做什么。 因此要对分词实验重做。 对实验设置做一些改变: 1. 放弃双输入,在分词任务下,因为语料比较大,外部Embedding意义不大,混淆视听。 2. 暂时放弃pretag、crf。这个后面肯定得做,因为有分析case看到分类模型存在的不足,但之后再做。目前关注于输入的编码。 3. 放弃simpleRNN,GRU. 3. 设置实验条件: unigtam, bigram, lexicon-feature, [type-feature], 应该可以写代码完成命令行开关相应特征的功能。基于窗口、基于bi-lstm。 4. CRFSuite、LTP删改特征,同样完成 unigram, bigram, lexicon-feature 的实验结果。LTP改起来应该更快,不过用CRFSuite也能熟悉下工具。

enhancement

模型包括 { unigram , bigram } x { single-input , double-input } x { classification , pre-tag , crf} 的任意组合(笛卡尔乘积),共12种。 其中`{unigram , bigram}`表示输入的词是使用单个字,还是连续的两个字;`{single-input , double-input}`分别表示仅使用随机初始化的Word Embedding 和 使用随机初始化的Embedding+在大规模训练语料上训练得到的Embedding;`{classification , pre-tag...

- [ ] 模型一 - [ ] 模型二 - [ ] 模型三 - [ ] 模型四 - [ ] 模型五

Hi , recently I am reading the code and founed it seems that : At MLPDroupoutLayer , there is no hidden layer added . First , hidden_unites defined here :...

# Problem Get non-monotonic timecode when a segment get both invalid `start` and `end`. See the following example. Raw data from alignment model: ``` seg start end seg1 Nan Nan...

https://github.com/openai/tiktoken/blob/095924e02c85617df6889698d94515f91666c7ea/src/lib.rs#L524 Hello, I'm reading the lib.rs code and found the `encode_with_unstable` api, tt donesn't seem to be used in the documentation? But it occupied so much in the lib.rs, and...

😂 I saw the paper and it seems nice. Maybe this repo need some introduction~