Alvin comments

Results 4 comments of


Alvin

我训练的是三个手势的图片（ 👌 ✌️ 👍 ），识别对应的手势准确率挺高的。但是随便给个其他照片，topk也输出了个高分的。这里我理解是，不在数据集范畴的图片，预测的时候结果集得分不应该这么高。

> 如果数据集的类别特别少的话，确实会出现这种情况，这是正常的情况哈。大佬，如果就只想识别特定的几个类别，这种情况要怎么避免呢？ topk给的预值都很高，如果预值低的话，可以根据预值低于多少，判断出预测不在类别里面。

我使用develop的分支，进行训练和预测，是跑通了的。

> > 比如识别一段 10分钟或者 30 分钟的音频。 > > 需要加入vad，后接asr使用。大佬，有没相关的资料可以参考一下呢？