zh-NER-TF icon indicating copy to clipboard operation
zh-NER-TF copied to clipboard

如果我不只是想提取人名机构地名,还要提取其他的话,能不能自己添加

Open TzeSing opened this issue 6 years ago • 15 comments

如果我不只是想提取人名机构地名,还要提取其他的话,能不能自己添加其他,

例如我想提取合同的甲乙方,能单独训练吗?

在哪里改呢?谢谢啊

TzeSing avatar Dec 12 '18 08:12 TzeSing

可以的,只要加上两个标签, 甲方、乙方,然后准备你自己的数据集就可以

qianggenxiadeshuihu avatar Dec 21 '18 11:12 qianggenxiadeshuihu

可以的,只要加上两个标签, 甲方、乙方,然后准备你自己的数据集就可以

谢谢你

TzeSing avatar Dec 24 '18 00:12 TzeSing

您好,我也想试试能不能提取更多的实体,我在tag2label增加了需要提取的实体,在utils.py中仿照现有实体写了个get_entity,语料也增加了对应的标记内容,但是报错IndexError: index 0 is out of bounds for axis 0 with size 0 想问问怎么回事,多谢

lucifffer218 avatar Dec 25 '18 13:12 lucifffer218

你是否重新训练了模型?@lucifffer218

MarcoLichao avatar Dec 26 '18 00:12 MarcoLichao

我使用自己的数据集,也重新训练了Word2id.pkl,数据集都是用tab隔开的,但是在python main.py --model=train 的时候这样报错

lucifffer218 avatar Dec 26 '18 02:12 lucifffer218

我使用自己的数据集,也重新训练了Word2id.pkl,数据集都是用tab隔开的,但是在python main.py --model=train 的时候这样报错

你可以debug到对应的地方,或者把自己的get_entity贴上来大家给你看一下 @lucifffer218

qianggenxiadeshuihu avatar Jan 07 '19 09:01 qianggenxiadeshuihu

您好,我想问一下,用自己的数据集,在数据处理阶段,怎么对数据进行bio标注呢,自动标注还是手工标注呢,手工标注工作量不是会很大吗?

jufengada avatar Apr 24 '19 05:04 jufengada

的数据集,在数据处理阶段,怎么对数据进行bio标注呢,自动标注还是手工标注呢,手工标注工作量不是会很大吗?

需要手动标注,一般也得标个几千条吧

qianggenxiadeshuihu avatar Apr 28 '19 03:04 qianggenxiadeshuihu

@lucifffer218 请问您是怎么重新训练word2id.pkl 我最近在考虑增加字向量的事情 但是加不进去 请问你甲方乙方的任务做成功没 我也像迁移其他领域的识别。期待得到您的回复,谢谢

chengming1108 avatar Jun 06 '19 02:06 chengming1108

我使用自己的数据集,也重新训练了Word2id.pkl,数据集都是用tab隔开的,但是在python main.py --model=train 的时候这样报错

你好,如果要使用自己的数据集,如何生成word2id.pkl文件呢

mingxixixi avatar Sep 27 '19 12:09 mingxixixi

IndexError: index 0 is out of bounds for axis 0 with size 0

新加了几个标签,报了IndexError: index 0 is out of bounds for axis 0 with size 0这个错误,有大神可以指导一下吗?

Y-Grace avatar Mar 23 '20 06:03 Y-Grace

我使用自己的数据集,也重新训练了Word2id.pkl,数据集都是用tab隔开的,但是在python main.py --model=train 的时候这样报错

您好,可以请教一下您怎么生成自己的向量吗,需要修改代码中的哪些地方呢

bingoc0207 avatar Apr 27 '20 14:04 bingoc0207

我使用自己的数据集,也重新训练了Word2id.pkl,数据集都是用tab隔开的,但是在python main.py --model=train 的时候这样报错

您好,可以请教一下您怎么生成自己的向量吗,需要修改代码中的哪些地方呢

+1, 同问如何生成Word2id.pkl

YijianLiu avatar Mar 24 '21 02:03 YijianLiu

新加了几个标签,报了IndexError: index 0 is out of bounds for axis 0 with size 0这个错误,有大神可以指导一下吗?

您好,我也遇到了这个问题。请教下您之前是怎么解决的呢?万分感谢

deidei266 avatar Feb 16 '22 03:02 deidei266

您发给我的信件已经收到。                     滕蔚

jufengada avatar Feb 16 '22 03:02 jufengada