Traffic-Classification icon indicating copy to clipboard operation
Traffic-Classification copied to clipboard

关于训练样本偏少的问题

Open WithHades opened this issue 3 years ago • 0 comments

还有一个问题就是,我分析了wangwei提供的预处理数据集,样本只有不到4w个,训练的样本其实很少。对于每个session,为什么只生成一个样本呢?难道只能在session建立阶段识别吗?中途抓包就识别不了吗?我认为不可取。我认为每个session可以生成多个样本。显著增加样本的数量,尤其对于样本数量少的数据集来说,训练效果应该会提高不少。

WithHades avatar Dec 16 '20 06:12 WithHades