fliesfaries
Results
1
comments of
fliesfaries
glm2 fp16 int8 的flm模型同样有这个问题,原版可以到10000token,现在4000token就爆显存了