Juntao Yu

Results 54 comments of Juntao Yu

@wangxinyu0922 yes you are right the code is out of date, I forgot that I shared the code with you:) The code was corrected after that. But for conll03 English,...

@wangxinyu0922 that's odd, I must copy some very old code there, sorry about the wrong code. But glad you now can train the model correctly :)

Biaffine 最早是用在 Dozat的parser里的,zero_initializer() 也是从原来的代码里就是这样的,我不记得他们有在paper里提到过为什么,估计是实验的结果比较好。 https://github.com/tdozat/Parser-v1/blob/0739216129cd39d69997d28cbc4133b360ea3934/lib/models/nn.py#L336

If you use JSON, you could simply output the `pred_ners` which is a list of mentions in the `[sentence_id, start_indicie, end_indice, ner_type]` format, so if you output the gold in...

For most of the corpora I train the model by 40k steps (not epochs) but for larger corpora such as ontonotes I train it up to 200k steps

你是需要那些数据集?主要是由于版权问题我没法把处理好的数据集直接贴在网上。只要你有所需要数据集的原版我就可以发给你处理好的文件了:)

没问题,邮箱给我下

原版数据集你需要去找LDC买的,我不能直接发给你。

我没有把ontonotes转换成conll03 BIO的格式,我是从Conll2012 corefernce的格式转换过来的,如果需要conll2012格式可以参考 https://github.com/kentonl/e2e-coref

我没有用中文的数据做实验,不过格式是一样的只是把英文换成中文而已 > On 3 Sep 2022, at 03:52, lzf1024 ***@***.***> wrote: > >  > 这个邮箱就是我的邮箱------------------ 原始邮件 ------------------ 发件人: ***@***.***> 发送时间: 2021年2月7日(星期天) 晚上7:19 收件人: ***@***.***>; 抄送: ***@***.******@***.***>; 主题: Re: [juntaoy/biaffine-ner]...