clusterdata
clusterdata copied to clipboard
Question about the net_in and net_out 's normalization factor in alibaba trace 2018 dataset
尊敬的阿里巴巴研究人员们: Hello. 首先感谢所公开的数据集,让学术界能从数值上了解数据中心网络。
通过处理alibaba trace 2018数据,我发现里面的 net_in 和 net_out 数值是单调递增的,考虑原始数据应该是通过类似 python psutil 的工具提取的流量数据累积值。数据被归一化后,其实际 瞬时流量的归一化值 = (后一个值-前一个值)/时间戳差。
想请教一下数据归一化时用的是什么值?或者大约是10的多少次幂级别? 谢谢。 我猜测它应该是 未归一化之前 net_in 和 net_out 里面的最大值,应该是相当大的一个数。 如果缺少这个值,net_in 和 net_out里面的数据较难使用。
Sincerely, 非常感谢。 Allen Guo. Wechat: 13468897661. Xidian University.