苏剑林(Jianlin Su)

Results 390 comments of 苏剑林(Jianlin Su)

save_weights保存的模型,load_weights绝对能加载,不存在什么无法读取的问题。

至于你想用load_weights_from_checkpoint加载,自然要用save_weights_as_checkpoint保存。把逻辑搞清楚了,就不会有什么问题。

暂时无~

1、这是个keras问题; 2、最简单的方式是将所有样本拼在一个batch中,然后对半分算loss,参考SimCSE的实现( https://github.com/bojone/SimCSE/blob/main/eval.py ); 3、直接实现也行,`y1=model(x1), y2=model(x2)`这样就是共享的

可以通过自行修改beam_search的源码输出。

> > 还没实验过英文的,晚点我实验一下看看。 > > 苏神,有结果了吗 没。对英文任务没什么兴趣,拖着还没弄~倒不如你说说你改动了什么?英文和中文不一样,task_sequence_labeling_ner_crf.py肯定是不能直接套的,你列举一下你改动之处,咱们对比一下?

> > > > 还没实验过英文的,晚点我实验一下看看。 > > > > > > > > > 苏神,有结果了吗 > > > > > > 没。对英文任务没什么兴趣,拖着还没弄~倒不如你说说你改动了什么?英文和中文不一样,task_sequence_labeling_ner_crf.py肯定是不能直接套的,你列举一下你改动之处,咱们对比一下? > > 我是直接套的。。。,顶多就是把labels改改 这应该不行吧。。。你好歹得观察一下data_generator的样本输出是不是正常吧,中文的脚本直接处理英文说不准会出现什么异常的呀。

权重转成tf格式后可以用,跟bert一样用法。 不过不建议在上面浪费时间,开源的只有一个没有什么价值的ernie 1.0而已。