Derek Liu
Results
3
comments of
Derek Liu
作者高估了用cpu进行infer的效率。且不说效率,光训练直接拉满近百张cpu,跪了
same,虽然没有测试精度,但是试了几张输入,没有几个能理解对的
> 我测试下来,只要安装了flash attention,tp就能正常使用,暂时还不清楚内部是什么原因 我确实之前没有安装flash attn,我试了pip install flash-attn,版本2.6.3,启动server时也没有出现flash attn的warning了,但我上述说的问题仍然存在😥没有任何变化