mingxixixi

Results 11 comments of mingxixixi

我的意思是用bert 做其他下游任务的时候,一般训练多少次就可以了😂------------------ 原始邮件 ------------------ 发件人: "albert-jin" 发送时间: 2019年12月11日(星期三) 凌晨0:03 收件人: "macanv/BERT-BiLSTM-CRF-NER"; 抄送: "mingxixixi";"Author"; 主题: Re: [macanv/BERT-BiLSTM-CRF-NER] 你好,想请教一下,用Bert模型一般训练多少次就可以了呢 (#280) 这个模型的bert是预训练已有的,直接funtuning,不需要自己训练 ---原始邮件--- 发件人: "mingxixixi"

> 语料中,每行的句子长度有没有限制 > 首先感谢老师对之前几个问题的解答,对我帮助很大。我仔细检查了自己的语料,确实发现了bug,调整后就运行成功了,不过现在我有两个疑问需要老师给予解答,谢谢! > 1.语料中,每行的句子长度有没有限制?如果有,在什么地方进行的规定? > 因为我在检查语料的时候,起初是以为有些句子过长,导致训练出了问题,就直接把长句子给拆分了,这个过程中发现了一些连续换行的问题(我认为这是我的语料的主要问题)。 > 2.word2vec训练出的词向量应当怎么用进去,我在程序中看到了这块内容,词向量模型应当是什么样的格式? 你好,如何使用预训练的词向量来训练模型,你解决了吗?

😂😂,那后来改对了吗------------------ 原始邮件 ------------------ 发件人: "wssgzxh" 发送时间: 2019年10月11日(星期五) 中午11:14 收件人: "Determined22/zh-NER-TF"; 抄送: "mingxixixi";"Comment"; 主题: Re: [Determined22/zh-NER-TF] 语料和W2V的疑问 (#36) 啊,都忘记了,很久没动那个了。我记得当时试出来的好像就是,词 向量这样的形式。 ---原始邮件--- 发件人: "mingxixixi"

> 感觉现在的代码是基于字标注的,主要使用的是区别特征,从这个层面上来讲随机的效果比预训练的好点(从我的使用来看),如果换成基于词标注,有可能预训练的embedding可能会比随机好点。 你好,如何使用预训练的词向量进行训练呢?

> 我数据集里出现多的空格的情况了,重新弄一下数据集就好了 你好,想请教一下,使用自己的数据集时,怎么生成word2id.pkl文件呢

> 我使用自己的数据集,也重新训练了Word2id.pkl,数据集都是用tab隔开的,但是在python main.py --model=train 的时候这样报错 你好,如果要使用自己的数据集,如何生成word2id.pkl文件呢

> @thy0621 你的格式有问题 标注的标签有缺失 你好,使用自己的数据时如何生成word2id.py呢

你好,你怎么用预训练好的词向量代替随机生成的词向量呢------------------ 原始邮件 ------------------ 发件人: "thy0621" 发送时间: 2019年10月2日(星期三) 下午5:48 收件人: "Determined22/zh-NER-TF"; 抄送: "mingxixixi";"Comment"; 主题: Re: [Determined22/zh-NER-TF] 更换语料库 (#81) @thy0621 你的格式有问题 标注的标签有缺失 你好,使用自己的数据时如何生成word2id.py呢 你好,时间有点久了,回忆了一下 你看一下data.py文件的代码 当初我是使用其中的read_corpus和vocab_build函数,单独放在一个python文件内,读取自己的文本,执行后生成的 — You are receiving this because...

你好,MRSA 数据集怎么转换成BIO 格式呢,有没有BIO 格式数据能不能给分享一下呢? ---原始邮件--- 发件人: "thy0621"

你好,这个人民日报的数据集是可以直接免费使用呢?