PaddleNLP icon indicating copy to clipboard operation
PaddleNLP copied to clipboard

[Docs]: 层次分类的功能描述是不是有问题?

Open DAAworld opened this issue 1 year ago • 2 comments

软件环境

paddle-bfloat                 0.1.7
paddleocr                     2.7.0.3
paddlepaddle                  2.5.1

详细描述

紫光圣果副总经理李明雷辞职  组织关系,组织关系##辞/离职
无理取闹辱骂扶贫干部织金一居民被行拘    司法行为,司法行为##拘捕
如果我有这两个train.txt数据集,那么我的label的标签按照文档的说法应该是:
label.txt
组织关系
组织关系##辞/离职
司法行为
司法行为##拘捕
看上去没啥问题,但是当我进行预测的时候,经常返回的只有组织关系、司法行为这样的一级分类,而不会把一二级分类都预测出来。
所以真正的文档描述是不是
紫光圣果副总经理李明雷辞职    组织关系##辞/离职
无理取闹辱骂扶贫干部织金一居民被行拘    司法行为##拘捕
label.txt
组织关系##辞/离职
司法行为##拘捕
是不是应该这样写?

DAAworld avatar Jan 29 '24 08:01 DAAworld

预测不出二级标签可能原因是因为训练数据较少,训练不够充分。这里层次分类问题可以理解为多标签问题。如果只想要预测二级标签,建议你直接在数据集中去掉一级标签,数据变为 紫光圣果副总经理李明雷辞职 组织关系##辞/离职 无理取闹辱骂扶贫干部织金一居民被行拘 司法行为##拘捕

lugimzzz avatar Feb 06 '24 05:02 lugimzzz

This issue is stale because it has been open for 60 days with no activity. 当前issue 60天内无活动,被标记为stale。

github-actions[bot] avatar Apr 27 '24 00:04 github-actions[bot]

This issue was closed because it has been inactive for 14 days since being marked as stale. 当前issue 被标记为stale已有14天,即将关闭。

github-actions[bot] avatar May 12 '24 00:05 github-actions[bot]