llp1992

Results 12 comments of llp1992

Qwen2.5-VL-72B-Instruct merge lora cuda oom,怎么处理?

> 命令行参数`--truncation_strategy delete`,样本的tokens超过`max_length`会被删除。 不是超过max_length被删除的原因,而是dataset map处理的时候被delete的