hlLi
Results
2
comments of
hlLi
+1 for that
> use_packed_ds设置成True的时候请确保use_custom_flash_attn也是True use_custom_flash_attn设置成True的时候会替换的函数是“_forward_gpt_oss_with_varlen”,但是1B的语言模型不是gpt,这个函数也是适用的吗?