mingxixixi comments

Results 11 comments of


                                            mingxixixi

你好，想请教一下，用Bert模型一般训练多少次就可以了呢

我的意思是用bert 做其他下游任务的时候，一般训练多少次就可以了😂------------------ 原始邮件 ------------------ 发件人: "albert-jin" 发送时间: 2019年12月11日(星期三) 凌晨0:03 收件人: "macanv/BERT-BiLSTM-CRF-NER"; 抄送: "mingxixixi";"Author"; 主题: Re: [macanv/BERT-BiLSTM-CRF-NER] 你好，想请教一下，用Bert模型一般训练多少次就可以了呢 (#280) 这个模型的bert是预训练已有的，直接funtuning，不需要自己训练 ---原始邮件--- 发件人: "mingxixixi"

语料和W2V的疑问

> 语料中，每行的句子长度有没有限制 > 首先感谢老师对之前几个问题的解答，对我帮助很大。我仔细检查了自己的语料，确实发现了bug，调整后就运行成功了，不过现在我有两个疑问需要老师给予解答，谢谢！ > 1.语料中，每行的句子长度有没有限制？如果有，在什么地方进行的规定？ > 因为我在检查语料的时候，起初是以为有些句子过长，导致训练出了问题，就直接把长句子给拆分了，这个过程中发现了一些连续换行的问题（我认为这是我的语料的主要问题）。 > 2.word2vec训练出的词向量应当怎么用进去，我在程序中看到了这块内容，词向量模型应当是什么样的格式？你好，如何使用预训练的词向量来训练模型，你解决了吗？

语料和W2V的疑问

😂😂，那后来改对了吗------------------ 原始邮件 ------------------ 发件人: "wssgzxh" 发送时间: 2019年10月11日(星期五) 中午11:14 收件人: "Determined22/zh-NER-TF"; 抄送: "mingxixixi";"Comment"; 主题: Re: [Determined22/zh-NER-TF] 语料和W2V的疑问 (#36) 啊，都忘记了，很久没动那个了。我记得当时试出来的好像就是，词向量这样的形式。 ---原始邮件--- 发件人: "mingxixixi"

请问可以分享您的预训练embedding吗？

> 感觉现在的代码是基于字标注的，主要使用的是区别特征，从这个层面上来讲随机的效果比预训练的好点（从我的使用来看），如果换成基于词标注，有可能预训练的embedding可能会比随机好点。你好，如何使用预训练的词向量进行训练呢？

您好，在更换数据集训练时，报了一个错误

> 我数据集里出现多的空格的情况了，重新弄一下数据集就好了你好，想请教一下，使用自己的数据集时，怎么生成word2id.pkl文件呢

如果我不只是想提取人名机构地名，还要提取其他的话，能不能自己添加

> 我使用自己的数据集，也重新训练了Word2id.pkl，数据集都是用tab隔开的，但是在python main.py --model=train 的时候这样报错你好，如果要使用自己的数据集，如何生成word2id.pkl文件呢

更换语料库

> @thy0621 你的格式有问题标注的标签有缺失你好，使用自己的数据时如何生成word2id.py呢

更换语料库

你好，你怎么用预训练好的词向量代替随机生成的词向量呢------------------ 原始邮件 ------------------ 发件人: "thy0621" 发送时间: 2019年10月2日(星期三) 下午5:48 收件人: "Determined22/zh-NER-TF"; 抄送: "mingxixixi";"Comment"; 主题: Re: [Determined22/zh-NER-TF] 更换语料库 (#81) @thy0621 你的格式有问题标注的标签有缺失你好，使用自己的数据时如何生成word2id.py呢你好，时间有点久了，回忆了一下你看一下data.py文件的代码当初我是使用其中的read_corpus和vocab_build函数，单独放在一个python文件内，读取自己的文本，执行后生成的 — You are receiving this because...

更换语料库

你好，MRSA 数据集怎么转换成BIO 格式呢，有没有BIO 格式数据能不能给分享一下呢？ ---原始邮件--- 发件人: "thy0621"

数据集

你好，这个人民日报的数据集是可以直接免费使用呢？