GlobalPointer_pytorch
GlobalPointer_pytorch copied to clipboard
全局指针统一处理嵌套与非嵌套NER的Pytorch实现
您好,我在运行evaluate.py的时候同样遇到了该问题,下面是报错信息,想请问下您能指点下吗 
请问作者有在其它数据集尝试GP模型吗? 有个疑惑,自己搜集了一些预料,用bert基础版预训练模型做了个训练,然后再测试集上预测时,出现了预测实体多且长的问题。 测试集一条样本: ```json { "text": "中国政府宣布2019年国防开支将比前一年增长7.5%,超过预计今年的经济增长率。第十三届全国人大第二次会议星期二(2019年3月5日)在开幕时公布的政府预算报告显示,今年的国防开支将达到11899亿元人民币,相当于大约1780亿美元。外界一般认为,中国实际的军事开支可能高出政府公开的国防预算金额。中国国防部公布的消息说,今年的国防预算将重点支持国防和军队改革,全面推动国防和军队现代化建设。中国每年一度的国防开支预告一直受到国际广泛关注。各国试图从中了解中国战略意图的变化和发展。", "entities": [ { "start_idx": 0, "end_idx": 4, "type": "ORG", "entity": "中国政府" }, { "start_idx": 6, "end_idx": 11, "type": "TIM", "entity": "2019年" }, {...
您好,您的工作很好的解决了本人标签嵌套的问题,但本人所做任务的标签数足足有接近一万个(细粒度非常高),这使得self.dense成为了一个将近4G的线性层,且由于每个标签单独的占用一个(1, seq_len, seq_len)空间,则在训练时需要较大时间和显存成本,请问作者有没有针对这种高细粒度标签的NER模型呢?非常感谢!
请问运行evaluate.py出现这个报错原因是什么呢?没有做任何修改
请问作者,目前使用该模型,对其他数据集进行实验时,比如 ontonotes 5.0 中文,效果并不理想,F1 才到22。百思不得其解。调整了学习率还是不佳,请教应从哪个角度着手解决呢?
数据集划分问题
请问数据集文件有dev、train和test,test是没标签,请问带有标签的测试集用来评估测试结果是哪个文件呢?dev文件是验证集吗?evaluate.py这个文件是做什么的呢?评估测试集结果和预测未知标签数据集都是这个吗?
作者你好,请问有在英文数据集中进行实验的效果吗
您好,我看您采用了旋转式位置编码RoPE,是不是意味着可以训练出1024长度的模型呢?