Traffic-Classification icon indicating copy to clipboard operation
Traffic-Classification copied to clipboard

Code for Intrusion Detection Systems and Encrypted Traffic Classification [No Further Updates]

Results 6 Traffic-Classification issues
Sort by recently updated
recently updated
newest added

![image](https://user-images.githubusercontent.com/32067974/197148259-025151b0-005e-405f-8482-027f29bfef02.png) 使用作者提供的npy文件,请问有遇到过类似错误的吗

解决方法: 进入 https://github.com/garrettj403/SciencePlots 安装一下即可

哈喽,我也是流量分类的研究生,从您的代码中学到很多,给了我很多思路。表示感谢! 另外,意外发现您还是“文艺数学君”的创建者之一。我也关注了文艺数学君。该网站也帮了我不少哦! 祝您生活愉快,工作顺利。再次表示感谢!

还有一个问题就是,我分析了wangwei提供的预处理数据集,样本只有不到4w个,训练的样本其实很少。对于每个session,为什么只生成一个样本呢?难道只能在session建立阶段识别吗?中途抓包就识别不了吗?我认为不可取。我认为每个session可以生成多个样本。显著增加样本的数量,尤其对于样本数量少的数据集来说,训练效果应该会提高不少。

因为你之前提到了你目前侧重数据集不平衡,我不建议对文件进行截取数量,wangwei论文以及你的代码都有截取指定数据,不截取对你的不平衡更有帮助

你好。我刚查看了youtube1.pcap,发现了brower的packet,因此我认为iscx数据集相当一部分在浏览器抓的包。因此brower以及vpn brower标签我们可以不要。但是数据包可以利用。再说到包具体的分类问题上,原论文中提到streaming只有vimeo以及youtube,但是wangwei的论文中streaming还包括了Netflix以及Spotify。我认为wangwei论文的分类是没有问题的。streaming我们应该定义为多媒体流,虽然VoIP也是流形式的,但是这是IP通话技术,更偏向双向。基于此,我定义了一份列表。随后我尝试搞定自动转移文件分类这一部分代码。