ChatYuan
ChatYuan copied to clipboard
代码效果略奇怪啊,finetune也没有效果
直接运行,就算在readme例子上的,我稍微改动两个字,输出就变上面这样了。
使用训练方法,就算是我直接复制训练数据的input字段作为输入, 使用本地模型后的推导效果也出不了我训练数据集的target。
这是为什么呢
请参考示例,带上用户:小元:前后缀训练试试看
@cspanda8989 简单运行测试,主要差别在于 do_sample,top_p 两个参数(colab 中还额指定了 temperature )。
具体原因需要等待模型代码开放之后才能分析判断了。
是的,这些参数很重要,需要根据实际场景调整