Alvin

Results 4 comments of Alvin

我训练的是三个手势的图片 ( 👌 ✌️ 👍 ), 识别对应的手势准确率挺高的。但是随便给个其他照片,topk也输出了个高分的。这里我理解是,不在数据集范畴的图片,预测的时候结果集得分不应该这么高。

> 如果数据集的类别特别少的话,确实会出现这种情况,这是正常的情况哈。 大佬,如果就只想识别特定的几个类别,这种情况要怎么避免呢? topk给的预值都很高,如果预值低的话,可以根据预值低于多少,判断出预测不在 类别里面。

我使用develop的分支,进行训练和预测,是跑通了的。

> > 比如识别一段 10分钟 或者 30 分钟的音频。 > > 需要加入vad,后接asr使用。 大佬,有没相关的资料 可以参考一下呢?