FastBERT
FastBERT copied to clipboard
关于论文中的FLOPs计算
请问论文中 BERT baseline的FLOPs为什么是21785M? 按照表一列的内容,BERT的FLOPs不应该是1809.9 * 12 + 46.1 = 21765M吗?
请问论文中 BERT baseline的FLOPs为什么是21785M? 按照表一列的内容,BERT的FLOPs不应该是1809.9 * 12 + 46.1 = 21765M吗?
作者代码里用thop库算出来的MACS为10892625664, 1MACS=2FLOPS,所以算出来总共的FLOPS=10892625664*2=21785M