jimi comments

Results 39 comments of


                                            jimi

测试集的格式

我在实际使用时，每个label都有一定数量的样本。没有要求每个label数量一样。因为是向量计算，样本数量过少，对fasttext没有意义。 guanleiming 于2018年12月18日周二14:13写道： > [image: default] > > > 大概就是十来个label吧，但是在每条最后面加上__label__xxxx，如果改成最前面加__label__xxxx这种格式是有效的，但是如果训练集的样本过少就会导致每个label的概率非常平均，就算把label的完整的一模一样的一段进行测试的概率也几乎是平均的，但是样本多起来了之后，测试的概率也变高了，没有那么平均，请问您在做的时候是否会出现这种现象？这种现象是否是样本少导致的过拟合？ > > — > You are receiving this because you commented. > > > Reply to this email...

jimi

测试集的格式

相同模型文件(官方 c++ 训练的 ftz)，预测结果不一致

相同模型文件(官方 c++ 训练的 ftz)，预测结果不一致

相同模型文件(官方 c++ 训练的 ftz)，预测结果不一致

预训练词向量没有生效

load 官方python版bin classifier 报错

load 官方python版bin classifier 报错

similar code?

在python版中用到了reduce_model在这里没有找到