yangliuIOC
Results
7
comments of
yangliuIOC
应该是 加入 你想要的数据进入数据集,他是微调的,以前的知识保留的比较少,
> @songsa1 推荐友情链接里的 chatglm-tuning 请问,你用过lora跑过 这个广告数据集么,
我的意思是,reward model 是hf训练出来的, 而不是sft 训练出来的。
lora 开大, 要不 他老嘴硬,在家丰富的数据