jimi
jimi
我在实际使用时,每个label都有一定数量的样本。没有要求每个label数量一样。 因为是向量计算,样本数量过少,对fasttext没有意义。 guanleiming 于2018年12月18日 周二14:13写道: > [image: default] > > > 大概就是十来个label吧,但是在每条最后面加上__label__xxxx,如果改成最前面加__label__xxxx这种格式是有效的,但是如果训练集的样本过少就会导致每个label的概率非常平均,就算把label的完整的一模一样的一段进行测试的概率也几乎是平均的,但是样本多起来了之后,测试的概率也变高了,没有那么平均,请问您在做的时候是否会出现这种现象?这种现象是否是样本少导致的过拟合? > > — > You are receiving this because you commented. > > > Reply to this email...
大概是因为java没有无符号整数导致的,这个问题之前修复过,请问是使用的是哪个版本?
也可能这个官方的c++版本变更了,我要实际对比看一看
项目迁移至https://github.com/mayabot/mynlp,使用那边的版本再试试
?不是太理解 是在mynlp里面的最新版本么 能具体给出哪行代码么
```xml com.mayabot.mynlp fastText4j 3.1.0 ``` 这个版本兼容最新的bin文件格式,你可以试试
fix in 3.1.6 ------------------ Original ------------------ From: "ares89"
not similar code Reference c language version implementation Designed different APIs Implemented with kotlin, the code is more readable Added flexible APIs such as WordSplitter Support custom file format, mmap...
这个reduce可能是新的功能,我还没研究 ---------- 该邮件从移动设备发送 --------------原始邮件-------------- 发件人:"azydon "