sserdoubleh

Results 74 comments of sserdoubleh

> thank you very much for your reply! Is it possible to convert the pretrained model saved with fluid.io.save_params to .pdparams format? You can use `fluid.io.load_program_state`. It loads parameters in...

> Hi,is it possible to load .pdparams model for fine-tuning with develop branch? Develop branch cannot support .pdparams now. Do you need to convert other pretrained model into Knover?

OK, I will update some convert tool later.

可以参考这个 issue:https://github.com/PaddlePaddle/Knover/issues/75

> > 可以参考这个 issue:#75 > > 好的,感谢,另外plato2是完全从头训练的是吧,有用在百科上预训练的Bert的参数吗? plato2是从头训练的,没有使用其他的预训练模型

CPU版本目前支持比较少 想问下哈,你应该主要是想要和模型交互吗?

这个问题,应该是 paaddlenlp 的报错? https://github.com/PaddlePaddle/PaddleNLP/issues

需要你提供下完整的训练情况哈,包括机器环境,以及训练配置 机器环境:GPU类型、GPU driver版本,CUDA版本、CuDNN版本、NCCL版本、Paddle版本 训练配置:训练模型的规模、batch size设置、训练用数据(最好直接用knover自带的data/example来测试)、其他可能影响训练性能的配置 目前我测试使用 fleetrun train.py (即scripts/distributed/train.sh)在自带的example数据上,跑 projects/PLATO-2/pretrain/24L_train_stage-1.conf 在V100单卡上,CUDA10.2,Paddle2.2.2 使用use_amp=true(2.5steps/s)是会显著快于use_amp=false(0.75steps/s)

能贴个 case 吗?type_id 对整个 context 都是0,response 是1,这个是正常的

你跑的中文是从哪里下载的?还是你自己训的呢?我这边用我的模型跑了下,效果是正常的