dzy

Peking University Beijing [email protected]

Results 90 comments of

dzy

希望作者的回复

把 --eval_batch_size 调小

关于预训练模型的问题

预训练浮点模型(对于量化可以是剪枝后的模型)

已修复。

这里，https://github.com/666DZY666/micronet/commit/45136477a61528f171351f70763d5334cb31aebe#diff-9673a485be40841c87237bb5f5dc0b0e718116160d9898089e9cefb662679524R24

请问下量化中的特征A是指啥意思呢？

网络中间特征（每层卷积的输入）

如何进行Dorefa的32位浮点型计算

是的。

大佬可以多在知乎上发表模型压缩优化的文章

请查看代码结构和项目进展，如有问题可以再讨论

可否将CONV3D,以及GRU量化一下？

后续可以考虑加入。

剪枝

此项目的剪枝通用性待加强。可以参考这个https://github.com/tanluren/yolov3-channel-and-layer-pruning

量化流程细节的疑问？

1、采用量化/反量化这个方式在之前范围实现离散化(量化)。量化-反量化-卷积和量化-卷积-反量化的结果是一样的。这里的量化训练采用前者是为了方便写代码，模拟量化的过程，验证量化精度；量化部署采用后者，量化卷积实现加速； 2、可以这样考虑，一方面如果是在通用平台部署可以自己做下剪枝等，然后放到已有框架上量化部署；一方面如果是FPGA或ASIC等，可以自己做剪枝/量化等，然后把纯参数提取出来去部署。当然，框架里也有压缩的部分，但大部分框架压缩这块儿其实做的不太好，且操作自由度不太高，也有必要借鉴下。

yolov5量化实验

1、量化训练会变慢的，2~3倍挺正常，NMS不清楚； 2、加载浮点模型，多开几个实验试试：相比浮点初始学习率X0.1，X0.01，X0.001，让波动小一点，但还是会比浮点大，正常； 3、先用默认的量化配置且head不要量化试试，看看掉多少。