PRGC Chinese field

Does the model support Chinese triplet extraction? thanks for your reply

May 09 '23 13:05 xddd-ys

你好，我没再继续用这个模型了

我也好奇请问你解决了吗

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

Jun 12 '23 09:06 xddd-ys

目前就传统的BERT+BiLSTM模型做的

你好，我没再继续用这个模型了

我也好奇请问你解决了吗

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

你好我想请问您现在使用的是什么模型来处理中文的训练集做关系抽取呢

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>

Jun 12 '23 09:06 xddd-ys

when I change the data into chinese, I found its effect perform badly

Aug 22 '23 10:08 githubgtl

when I change the data into chinese, I found its effect perform badly

我也发现了

Aug 23 '23 04:08 khazic

when I change the data into chinese, I found its effect perform badly

我也发现了

你解决了嘛

Aug 29 '23 07:08 githubgtl

我改了源代码你说的差是有多差我目前测出来中文的f1在71左右

Aug 29 '23 08:08 khazic

只有2.1

Aug 29 '23 08:08 githubgtl

我就修改了它的模型换成了bert-wwm，然后把数据集换成中文的

Aug 29 '23 08:08 githubgtl

我改了源代码你说的差是有多差我目前测出来中文的f1在71左右

可以给我看看你改的源码嘛，

Aug 29 '23 08:08 githubgtl

我也在用这个模型做中文的关系抽取，我们三个能交流一下吗？

Aug 29 '23 13:08 258508

我也在用这个模型做中文的关系抽取，我们三个能交流一下吗？

可以啊我的qq是2813397632

Aug 29 '23 13:08 githubgtl

可以

Aug 30 '23 06:08 khazic

可我加您还是您加我，我qq在上面

Aug 30 '23 06:08 githubgtl

我的qq是2585081745

Aug 30 '23 13:08 258508

我改了源代码你说的差是有多差我目前测出来中文的f1在71左右

你好，想搞中文的要怎么整，只要换个预训练吗，我换个直接爆显存了

Apr 08 '24 14:04 zjutnlper

我改了源代码你说的差是有多差我目前测出来中文的f1在71左右

可以给我看看你改的源码嘛，

你好，想用自己的中文数据集应该怎么改源码呢，我就换了个预训练，效果特别差

Apr 09 '24 05:04 zjutnlper

主要是tokenizer部分

Apr 09 '24 05:04 khazic

主要是tokenizer部分

那块怎么了吗，源码就调用了huggingface那个接口，没看出啥不合理，请指教大佬

Apr 09 '24 06:04 zjutnlper

太久远了记不大清楚了英文的token跟中文的token不同你直接换模型 bert-large肯定适配不了很好的chinese啊每个模型有他自己的vocabulary

Apr 09 '24 06:04 khazic

太久远了记不大清楚了英文的token跟中文的token不同你直接换模型 bert-large肯定适配不了很好的chinese啊每个模型有他自己的vocabulary

我是换了预训练模型的，bert-Chinese这个，效果确实不好

Apr 09 '24 06:04 zjutnlper

我的意思不是模型不好是每个模型的tokenizer就不一样他的源码是英文的编码逻辑你现在换中文的肯定不行的你得把tokenizer换成是中文的那种分词逻辑才行的

Apr 09 '24 06:04 khazic

我的意思不是模型不好是每个模型的tokenizer就不一样他的源码是英文的编码逻辑你现在换中文的肯定不行的你得把tokenizer换成是中文的那种分词逻辑才行的

大佬，那该怎么改，无经验

Apr 09 '24 06:04 zjutnlper

我的中文训练集是800条，处理完送入训练变成1221条了，这是为什么？

May 17 '24 07:05 258508

PRGC PRGC copied to clipboard

Chinese field

PRGC
PRGC copied to clipboard