masktextspotter.caffe2 icon indicating copy to clipboard operation
masktextspotter.caffe2 copied to clipboard

您好,请问当前模型对中文的识别效果怎么样?

Open Bachelorwangwei opened this issue 6 years ago • 5 comments

您好,请问当前模型对中文的识别效果怎么样?

Bachelorwangwei avatar Dec 26 '18 13:12 Bachelorwangwei

中文模型只需要适当减少Mask branch的batch size即可顺利进行训练和测试,但是没有在中文上做过系统的实验。目前中文的数据集不够完善,很难进行公平的对比。很多时候,数据往往比模型更重要。

MhLiao avatar Dec 27 '18 03:12 MhLiao

中文模型只需要适当减少Mask branch的batch size即可顺利进行训练和测试,但是没有在中文上做过系统的实验。目前中文的数据集不够完善,很难进行公平的对比。很多时候,数据往往比模型更重要。

请问减少 Mask branch 的 batch size 是指什么?另外 character maps 的 channel 数是不是要相应更改呢,因为中文字的个数不是 26 个,不可能增加几千个 channel 吧,但只增加一个 channel 的话会不会影响汉字识别的效果呢?

谢谢

sibosutd avatar Dec 29 '18 02:12 sibosutd

中文模型只需要适当减少Mask branch的batch size即可顺利进行训练和测试,但是没有在中文上做过系统的实验。目前中文的数据集不够完善,很难进行公平的对比。很多时候,数据往往比模型更重要。

请问减少 Mask branch 的 batch size 是指什么?另外 character maps 的 channel 数是不是要相应更改呢,因为中文字的个数不是 26 个,不可能增加几千个 channel 吧,但只增加一个 channel 的话会不会影响汉字识别的效果呢?

谢谢

  1. Mask branch的batch size 是指输入mask 分支的ROI 的个数。
  2. character maps 的个数等于字符类别数量 + 1。
  3. 建议减少Mask branch batch size的原因是因为中文场景下 character maps 数量比较多,会占用更多的显存。 另外中文场景下training 和 inference 速度理论上也会慢上不少。

lvpengyuan avatar Dec 29 '18 02:12 lvpengyuan

中文模型只需要适当减少Mask branch的batch size即可顺利进行训练和测试,但是没有在中文上做过系统的实验。目前中文的数据集不够完善,很难进行公平的对比。很多时候,数据往往比模型更重要。

请问caffe2使用的是哪个branch?

ustczhouyu avatar Jan 15 '19 08:01 ustczhouyu

中文模型只需要适当减少Mask branch的batch size即可顺利进行训练和测试,但是没有在中文上做过系统的实验。目前中文的数据集不够完善,很难进行公平的对比。很多时候,数据往往比模型更重要。

请问减少 Mask branch 的 batch size 是指什么?另外 character maps 的 channel 数是不是要相应更改呢,因为中文字的个数不是 26 个,不可能增加几千个 channel 吧,但只增加一个 channel 的话会不会影响汉字识别的效果呢? 谢谢

  1. Mask branch的batch size 是指输入mask 分支的ROI 的个数。
  2. character maps 的个数等于字符类别数量 + 1。
  3. 建议减少Mask branch batch size的原因是因为中文场景下 character maps 数量比较多,会占用更多的显存。 另外中文场景下training 和 inference 速度理论上也会慢上不少。

请问character maps是text_mask_rcnn_heads.py中的num_cls吗?

oysz2016 avatar Apr 23 '19 13:04 oysz2016