Gang Dai
Gang Dai
暂时还没开发多卡的训练的版本哦~
> 研究了一个晚上发现了几个问题 **第一,使用`user_generate.py`生成的单位是106,而用`test.py`生成的单位却是468,都是引用了同一个.pth文件为何会这样**   > > **第二,使用`user_generate.py`生成的字十分的潦草,即使尽力把预处理做好,虽能看出与‘test.py'确实不同** **该如何达到`readme`中的效果**   **我尝试过给了30个去推演,结果风格都是一笔划写的字,因为预训练模型不是同一个吗?**  `user_generate.py`生成的  自己写的 感谢你的反馈,我这边大概分析了一下。原因感觉还是数据差异的问题,具体来说的话:我们训练时候的数据是使用的公开数据集,笔画宽度是均匀的,你的数据似乎是平板采集的,具有更加真实的笔画宽度,由于跟训练数据的分布差异过大,导致模型倾向于给出一个平均化的风格,这个平均化的风格指的是训练集所有的风格的平均。想要提高效果的话,fine-tune一下应该会好很多,可以让模型适应一下你的数据。 另外,你的第一个问题,因为``user_generate.py``只生成你一个人的6733个文字,所以iteration是``6733/64=105.2`` (64是batchsize)的大小。``test.py``是生成测试集中60个书写者的6733个文字,然后每个书写者采样生成500个所以iteration是``60×500/64=468.75``。 你贴的最后一张图是SDT的一个拓展,我们引入了一个额外的装饰网络,为SDT生成的均匀笔画的文字增加了笔画宽度和颜色。
> 提问:按照作者给出的python user_generate.py --pretrained_model checkpoint_path --style_path style_samples运行后,再添加图片生成出来的字和原来所生成的字的字一模一样是什么原因:) 原来生成的字指的是什么?
> (base) C:\Windows\System32>python user_generate.py --pretrained_model checkpoint_path --style_path style_samples python: can't open file 'C:\Windows\System32\user_generate.py': [Errno 2] No such file or directory 下载的文件里没找到有user_generate.py诶 重新下载最新版的文件
> 感谢 @YZcat2023 分享经验。 > > 也分享一张生成结果。效果没有那么好,但也不算飞线飞得太厉害。 > > > 图中上半部分是二值化处理后的图片。 > > 笔画的线条可能还是偏粗,不确定是不是这个因素,导致推理结果还是往草书的方向去演化了? @dailenson > > 另外,私人化的一些步骤是: > > 1. 手写是在iPad上用 Notes 和 Apple Pencil(一代) 完成的,屏幕上选第3种笔,因为它的笔画粗细一致,不受压感影响;设置网格背景,选较大的那个方格。 > 2. 在iPad上截屏,然后沿着网格线裁剪,只保留包含文字的整片区域。...
> 针对个人之前的实验方式,做了些改进。 > > 取消了二值化处理,之前用只是为了去除网格线,但二值化处理会导致文字线条不平滑。    > > 现在改为在裁剪图片前,提供同一组字的有网格和无网格背景的两张图片,先对有网格的选取截图区域,然后再用同样的截图区域,从无网格的图片中截取包含文字的部分。 > > 如此处理后,生成的文字,草书现象基本可以忽略了。 > > 但新问题是,输出与输入相比,真的很不像!特此请教两位,是哪个环节的问题呢,该如何优化? @dailenson @YZcat2023 > > >  上方是输入,下方是输出。 > > > 制作为字体后的输出效果。 我感觉可能是笔画宽度的问题。
> > > 针对个人之前的实验方式,做了些改进。 > > > 取消了二值化处理,之前用只是为了去除网格线,但二值化处理会导致文字线条不平滑。    > > > 现在改为在裁剪图片前,提供同一组字的有网格和无网格背景的两张图片,先对有网格的选取截图区域,然后再用同样的截图区域,从无网格的图片中截取包含文字的部分。 > > > 如此处理后,生成的文字,草书现象基本可以忽略了。 > > > 但新问题是,输出与输入相比,真的很不像!特此请教两位,是哪个环节的问题呢,该如何优化? @dailenson @YZcat2023 > > >  上方是输入,下方是输出。...
> 没有英伟达显卡有办法用吗 没有显卡的话就用Cpu啦,会慢一点。
试试把``test.py``中的31行直接删掉?
> 请问您3分钟可以执行一遍的`gpu`配置是?我用T4跑一遍需要12分钟 > > > checkpoint_path要从网盘里面下载,readme里面有给下载链接,checkpoint在网盘的`saved_weights/Chinese/`路径下面。我测了一下,有`gpu`的情况下,3分钟左右就可以生成6763个中文字符,生成的字符存放在`Generated/Chinese_User`路径。 我的是``RTX 3090``