BPO
BPO copied to clipboard
从头到尾训练自己的模型
请问如果我想从头训练一个自己的模型,从构建数据开始,我看到你的readme里面包括data_construct的介绍,那examples_ctx.json里面有good_res和bad_res,请问这种是如何生成的呢,对于model training 是只使用了类似于finetune_train_examples.jsonl里面的格式的数据吗?所以请问你testset里面的数据集是为了验证你的模型的优越性吗?请问你可以详细说一下bpo_test.json这个文件的作用吗?这个文件是如何生成的呢?
整个流程其实我大概清楚了,但是我如何得到类似于examples_ctx.json这样的数据呢?bpo数据集没有instruction和context字段