tfdetang
tfdetang
拿CTC的原始输出就知道每个字在文本行的 起始loc与结束loc,结合整个输出长度自己算一下就行了
是不是忘了把dropout去掉了啊,理论上网络权重固定以后同样的输入应该会给到同样输出的呀
楼主、最近我也在做票据识别相关项目,看了你上面的demo,感觉有些地方表现的好,但是有些地方也有问题,不知道愿不愿意一起交流下。 我的微信 weikunt
> > 不知道是否能添加Dockerfile和 docker-compose.yml 方便在群晖或其他服务器上快速部署,谢谢 > > docker run -d --name music -p 8089:8089 -p 8080:8080 -e IP=1.1.1.1 -e QQ=123456 jonnyan404/jusic >  谢谢大佬,亲测可用
> 现在的代码不太合理,在做透视变换前会放大图片,导致纹理信息丢失,这样做的初衷是想让背景和文字一起做投影变换,并且变换后不会出现用于填充的白边。但其实背景没必要一起做变换,可以单独做增强,然后把投影变换之后的文字贴在增强的图上 我自己也有这个需求,但是感觉其实背景应该和文字一起做变换,不然也会很奇怪吧。主要问题还是背景那边不应该做固定缩放,而是可以设置缩放比例,或者加入一定的随机缩放,似乎效果会好一些。
我是上淘宝买了一套点阵字体然后生成的