yhcc comments

Results 174 comments of


                                            yhcc

The question of results

所有的获得paper结果的超参数应该都是直接hard encode在脚本里了，应该直接运行就可以获得论文报道的性能了。

Thanks for your attention. I do not see other limitations. The tokenization part may need some adaptation, mainly for the add_prefix_space. https://github.com/yhcc/CNN_Nested_NER/blob/91ec7ec42ddf4ca70bb0be6c89d2e915a07a5501/data/ner_pipe.py#L12-L28 Actually you can just delete this line https://github.com/yhcc/CNN_Nested_NER/blob/91ec7ec42ddf4ca70bb0be6c89d2e915a07a5501/train.py#L103-L105...

建议

你说的问题确实是存在的，但大部分模型应该都是一致的，这里面最大的困难可能是任务评测的需要导致了有一些评测会看起来挺吃力的（比如有的需要给定一些token，而有的不需要；另外就是例如一些评测ALSC的，但实际是从AESC中抽取出来的结果）。这里面应该最大的出入地方应该是那个eos不是copy的，而是直接生成的，这个地方是由于画图的时候copy的话画图比较容易，但实际实现的话直接生成会更容易；另外还有一个比较小的出入是，在wang数据集中，任务的task_id是会重复一下，这个算是一个empirically效果更好的实现吧。

yhcc

The question of results

Longformer integration

建议

the metric

the metric

the metric

训练好的模型预测问题

关于logs日志loss文件为空及fitlog展示问题

是否考虑过将decoder部分的任务转换为预测词角标，而不是bpe index

关于模型的测试问题