CLUENER2020 icon indicating copy to clipboard operation
CLUENER2020 copied to clipboard

官方标签分布统计错误

Open heyoma opened this issue 3 years ago • 2 comments

当一个句子中出现多次同一词语被标注为同一实体类型时,官方只计数了一次。 比如 {"text": "两队上季曾在足总杯中相遇,纽卡客场0比0,主场4比1过关。不过纽卡本季的表现实在糟糕,", "label": {"organization": {"足总杯": [[6, 8]], "纽卡": [[13, 14], [31, 32]]}}} 官方计数为2,实际应为3

heyoma avatar Oct 11 '21 07:10 heyoma

问题不大,只是想提醒一下。写论文或发表时引用该数字会不太严谨

heyoma avatar Oct 11 '21 07:10 heyoma

我也发现了这个问题,转成我们平台的格式,发现两边统计分类数不一致,实际应为: {'name': 3755, 'company': 2980, 'game': 2376, 'organization': 3210, 'movie': 1123, 'address': 2891, 'position': 3141, 'government': 1835, 'scene': 1521, 'book': 1139}

ocean33 avatar Jan 14 '22 06:01 ocean33