Gang Dai
Gang Dai
> > > 没有英伟达显卡有办法用吗 > > > > > > 没有显卡的话就用 Cpu 啦,会慢一点。 > > 能讲一下怎么用CPU吗 我抽空整理一个cpu版本
> FileNotFoundError: [Errno 2] No such file or directory: 'data\CASIA_CHINESE\Chinese_content.pkl' 大佬这又是因为什么a 你下载好了``Chinese_content.pkl``这个文件吗?
> > > > > 没有英伟达显卡有办法用吗 > > > > > > > > > > > > 没有显卡的话就用 Cpu 啦,会慢一点。 > > > > > > > > >...
``character_dict.pkl``存的是字符,``Chinese_content.pkl``存的是字符对应的标准图像,``writer_dict.pkl``存的是书写者id和对应的顺序映射
跟文件名应该没关系,可以试试对裁剪出来的图片做个简单的二值化处理,应该能提升效果https://github.com/dailenson/SDT/issues/59#issuecomment-1963233481
微软雅黑是标准字体,我们这个都是在手写体上训练的,domain gap会有点大... 不过看生成你生成的结果,至少字符的倾斜程度好像学的还可以哈哈哈
> 我的猜测是这样的:你的图片如果是手写的,那么实际上可能有很多那种小的噪点,毕竟白纸细看也不是完全光滑完全白的,你用加亮之类的也会有个度,终究会有不少噪点留下来 我的实际测试是我拿iPad写的16个字没有纸质写的同样16个字那么狂草,正常人基本都能看得懂 能把生成结果贴出来看下嘛?
> > > 能把生成结果贴出来看下嘛? > > > 这个是纸上写的数据集生成的 > > >  > > > 这个是iPad写的生成的 > > >  那感觉将纸上写的字拍照后,做个简单的二值化处理后再输入模型中,应该能缓解“狂草”问题
可以看下这位老铁的复现结果https://github.com/dailenson/SDT/issues/75#issuecomment-2031897517
感谢您的建议~后期我们会考虑把项目发布在hugging face上