dzy

Results 90 comments of dzy

把 --eval_batch_size 调小

预训练浮点模型(对于量化可以是剪枝后的模型)

这里,https://github.com/666DZY666/micronet/commit/45136477a61528f171351f70763d5334cb31aebe#diff-9673a485be40841c87237bb5f5dc0b0e718116160d9898089e9cefb662679524R24

网络中间特征(每层卷积的输入)

请查看 代码结构 和 项目进展,如有问题可以再讨论

后续可以考虑加入。

此项目的剪枝通用性待加强。 可以参考这个https://github.com/tanluren/yolov3-channel-and-layer-pruning

1、采用量化/反量化这个方式在之前范围实现离散化(量化)。量化-反量化-卷积 和 量化-卷积-反量化的结果是一样的。这里的量化训练采用前者是为了方便写代码,模拟量化的过程,验证量化精度;量化部署采用后者,量化卷积实现加速; 2、可以这样考虑,一方面如果是在通用平台部署可以自己做下剪枝等,然后放到已有框架上量化部署;一方面如果是FPGA或ASIC等,可以自己做剪枝/量化等,然后把纯参数提取出来去部署。当然,框架里也有压缩的部分,但大部分框架压缩这块儿其实做的不太好,且操作自由度不太高,也有必要借鉴下。

1、量化训练会变慢的,2~3倍挺正常,NMS不清楚; 2、加载浮点模型,多开几个实验试试:相比浮点初始学习率X0.1,X0.01,X0.001,让波动小一点,但还是会比浮点大,正常; 3、先用默认的量化配置且head不要量化试试,看看掉多少。