hlLi

Results 2 comments of hlLi

> use_packed_ds设置成True的时候请确保use_custom_flash_attn也是True use_custom_flash_attn设置成True的时候会替换的函数是“_forward_gpt_oss_with_varlen”,但是1B的语言模型不是gpt,这个函数也是适用的吗?