GlobalPointer_pytorch
GlobalPointer_pytorch copied to clipboard
标签数量
您好,您的工作很好的解决了本人标签嵌套的问题,但本人所做任务的标签数足足有接近一万个(细粒度非常高),这使得self.dense成为了一个将近4G的线性层,且由于每个标签单独的占用一个(1, seq_len, seq_len)空间,则在训练时需要较大时间和显存成本,请问作者有没有针对这种高细粒度标签的NER模型呢?非常感谢!