Ask-Anything
Ask-Anything copied to clipboard
训练参数问题
三阶段训练 max_txt_l = 512 参数什么作用,由于显卡只有40G,显存需要将max_txt_l下调,下调会有出现影响呢?
max_txt_l影响的是llm回复的长度,当长度大于max_txt_l会被截断,下调的话只对长对话和部分caption生成有影响
三阶段训练 max_txt_l = 512 参数什么作用,由于显卡只有40G,显存需要将max_txt_l下调,下调会有出现影响呢?
max_txt_l影响的是llm回复的长度,当长度大于max_txt_l会被截断,下调的话只对长对话和部分caption生成有影响