Harold Yang
Harold Yang
您好,我用了800正样本和800负样本,训练完之后连训练样本都通不过测试,这个是不是不正常的现象?
但是样本量少也不应该连训练数据都通不过吧
好的,我回头跟进一下,多谢!特征点的问题,我感觉是训练有问题。我debug的时候,发现训练出来的模型好像有问题,比如,有一些model里的value是-3.04*10^8之类数字(好像还不少),导致一次调整之后就变成INF了。不知道你有没有碰到过这种问题?特征点我用的是LBF训练出来的,68个特征点,感觉没有问题啊。
@kensun0 我找到我这里的问题了,很扯的一个事.....我在我的工程里,不知道怎么回事,居然有两套linear.cpp和linear.h。更奇怪的是,两套里面对于feature_node的定义不一样,一个value是float,另一个value是double。这个错误使得我在训练GlobalRegression和使用它做调整的时候,feature_node数组的读取步长不一样,直接导致了很多错误的数据。 @hanweijing 你那个问题我好像还没碰到。。。
@kensun0 是的,旧版本,我在更新新版本,待会看看你们说的问题
@kensun0 新版本我现在刚在训练。看了一下你们讨论的这个问题,理论上想的话,要想加快选取负样本的速度,一是增加待选负样本(增加空间容量),二是移除已测试拒绝的负样本(提高可用负样本的密度)。而且,可能后者更重要一点。
@kensun0 @hanweijing 我按照新代码训练完了,没有出现很难找负样本的情况。。。。但是。。训练出来的效果比用旧的代码要差是怎么回事,特征点不准确。
@hanweijing 我试一下,最近在整理训练用库