step_into_llm
step_into_llm copied to clipboard
transformer的ipynb代码运行速度较慢
将矩阵乘法和全连接dense放在fp16下速度快很多