Ume-technology
Ume-technology
老师您好,我再请教一个问题,对于训练数据中,文字是弯曲性状的,或者说不规则性状的样式,训练数据中的文字坐标是如何识别出来的呢? 您能不能指点一下。 另外我作为图像方向新的菜鸡,我想知道我如果需要使用您这个模型,我需要对我的数据做怎样的数据预处理呢?我看到您训练数据的格式都是统一的大小格式,我是不是也需要把我自己的图像也处理成您发布的数据格式呢,因为我试着把我的数据集识别了文字坐标,生成了all_gts文件,也生成了structure_im文件,但是爆出了tensor无法拼接的异常,因此我也试着去debug了您的model文件夹中的代码,整体的模型实现对我来说流程还是相对复杂的,因此我还是想让您在上述的两个问题上给我指点一二。我的提问不在于我使用了我的数据导致model中的tensor维度出现错误,因为如果是那样,我会再去学习代码。我的目的在于您能否明确的告诉我该模型的数据是否以及需要怎样的数据预处理。 以免我在运行代码之初就走错方向。 感谢老师的耐心!
另外由于您的这个模型并没有发布训练过程的打算,我如果能跑通您这个流程,也算是我的一个工具集中的一个工具。 感谢老师您的工作! 还是希望老师能针对上述问题指点一二。
感谢老师的帮助。我已经运行成功了老师的代码。出现tensor cat异常确实和图像的尺寸有关。 老师给出的数据集的尺寸都是512 * 512,否则就会报错,因此需要尺寸的统一这样的预处理。 但是老师,我好想看到您的这个代码的训练过程。您能不能私发一份给我呢? 如果老师不便在GitHub上答复这个问题,我的微信是18336304089 邮箱是 [email protected] ; 学生感激不尽,千真万确只做学习。无论如何,真的感谢老师的帮助与指导!