fliesfaries

Results 1 comments of fliesfaries

glm2 fp16 int8 的flm模型同样有这个问题,原版可以到10000token,现在4000token就爆显存了