FlyingQianMM

Results 154 comments of FlyingQianMM

如果是一个人既要识别成人,又要识别成女人还是男人,或者其他的属性,这样的多标签图像分类任务暂时不支持。 如果像您说的识别多国车牌,感觉像不是多标签分类。可以把需求描述的更多一点吗,方便我们了解到位。

语义分割任务的数据标注和格式转换参考文档 https://paddlex.readthedocs.io/zh_CN/develop/data/annotation/semantic_segmentation.html 表计检测的分割标注图中有三个类别:0(背景)、1(指针)、2(刻度针)。指针和刻度针的标注参考上述文档即可。

标注过程中只需要标注非背景类别,步骤与文档描述一致即可。在标注转换的时候,会将非目标的区域自动归类为背景,对应的类别id为0,目标类别id从1开始计数生成。

> https://github.com/PaddlePaddle/PaddleX/issues/323#issue-706183858 我们这个案例里面只有两种表,一种刻度根数为50, 另一种刻度根数为32。因此提供的python预测脚本里面,是通过检测出的刻度根数来判断表盘类型。如果刻度根数小于TYPE_THRESHOLD(40),则为第二种表盘。 你提供的这张图片较为模糊,直接使用我们提供的预训练模型分割出来后的结果如下: ![visualize_1600933069323](https://user-images.githubusercontent.com/22235422/94116354-80977c80-fe7d-11ea-82e0-c5baecebc518.jpg) 此时分割出的刻度根数为39,代码会将其判断为第二种类别。如果修改TYPE_THRESHOLD为35,即可以得到正确的读数: ![visualize_93860436-b27bd800-fcf1-11ea-9224-499e49f2b4bf](https://user-images.githubusercontent.com/22235422/94116496-b63c6580-fe7d-11ea-8a48-9e5dd3b585ae.jpg)

> https://github.com/PaddlePaddle/PaddleX/issues/323#issuecomment-696586880 读数为负,是因为语义分割没有分割出指针,直接使用我们提供的预训练模型对你这张图片分割出来后的结果如下: ![visualize_1600932806900](https://user-images.githubusercontent.com/22235422/94125656-387e5700-fe89-11ea-8df9-320b7b6a7545.jpg) 由于没有分割出指针,因此计算得出的scale为默认值-1 (参考https://github.com/PaddlePaddle/PaddleX/blob/98f951054b1722577d34e170c45d709e0c55cbd2/examples/meter_reader/reader_infer.py#L290-L302 ), 而刻度根数小于TYPE_THRESHOLD,判断为第二种表盘,最终读数为scale * scale_value = -1 * 0.05。 我们这个案例提供的训练数据数量有限且变化单一,对于你这样的表盘类型没有覆盖,所以直接使用我们提供的预训练模型对实际场景中各式各样的表盘进行分割时结果可能会不正确,建议针对新的数据重新训练finetune。 表计读数案例的部署代码后续我们也会添加注释,增强代码的可读性和可修改性。

> 1、有底纹时,分割不准。2、负数情况需要添加字符识别。3、表盘精度过高,识别有误。 1. 可以增加有底纹的图片到训练集中,增加样本的丰富度 2. 负数情况需要根据这种表盘类型制定读数的计算方式,例如起始值从-0.1开始 3. 表盘精度过高时,可以尝试下训练时增大分割器的输入;或者尝试更换分割器为对小像素有更强的特征提取能力的模型,例如hrnet

该问题已修复解决,下一个版本会运行正常。

paddlepaddle-gpu 1.8.5.post107训RTX3090会有点问题,试下最新的paddle

> 模型训练非常慢,之前1.3.11的PaddleX只需要二十几个小时,2.0.0的PaddleX需要一百多个小时 这个具体是跑的什么模型呢?参数设置前后都是一样的吗? > 模型剪裁的时候,模型大小不减反增,由剪裁之前的471M变成475M; 这个具体是怎么设置剪裁时的参数呢?