Traffic-Classification
Traffic-Classification copied to clipboard
关于训练样本偏少的问题
还有一个问题就是,我分析了wangwei提供的预处理数据集,样本只有不到4w个,训练的样本其实很少。对于每个session,为什么只生成一个样本呢?难道只能在session建立阶段识别吗?中途抓包就识别不了吗?我认为不可取。我认为每个session可以生成多个样本。显著增加样本的数量,尤其对于样本数量少的数据集来说,训练效果应该会提高不少。