PaddleNLP
PaddleNLP copied to clipboard
[Docs]: 层次分类的功能描述是不是有问题?
软件环境
paddle-bfloat 0.1.7
paddleocr 2.7.0.3
paddlepaddle 2.5.1
详细描述
紫光圣果副总经理李明雷辞职 组织关系,组织关系##辞/离职
无理取闹辱骂扶贫干部织金一居民被行拘 司法行为,司法行为##拘捕
如果我有这两个train.txt数据集,那么我的label的标签按照文档的说法应该是:
label.txt
组织关系
组织关系##辞/离职
司法行为
司法行为##拘捕
看上去没啥问题,但是当我进行预测的时候,经常返回的只有组织关系、司法行为这样的一级分类,而不会把一二级分类都预测出来。
所以真正的文档描述是不是
紫光圣果副总经理李明雷辞职 组织关系##辞/离职
无理取闹辱骂扶贫干部织金一居民被行拘 司法行为##拘捕
label.txt
组织关系##辞/离职
司法行为##拘捕
是不是应该这样写?
预测不出二级标签可能原因是因为训练数据较少,训练不够充分。这里层次分类问题可以理解为多标签问题。如果只想要预测二级标签,建议你直接在数据集中去掉一级标签,数据变为 紫光圣果副总经理李明雷辞职 组织关系##辞/离职 无理取闹辱骂扶贫干部织金一居民被行拘 司法行为##拘捕
This issue is stale because it has been open for 60 days with no activity. 当前issue 60天内无活动,被标记为stale。
This issue was closed because it has been inactive for 14 days since being marked as stale. 当前issue 被标记为stale已有14天,即将关闭。