Gang Dai

Results 122 comments of Gang Dai

> > > 没有英伟达显卡有办法用吗 > > > > > > 没有显卡的话就用 Cpu 啦,会慢一点。 > > 能讲一下怎么用CPU吗 我抽空整理一个cpu版本

> FileNotFoundError: [Errno 2] No such file or directory: 'data\CASIA_CHINESE\Chinese_content.pkl' 大佬这又是因为什么a 你下载好了``Chinese_content.pkl``这个文件吗?

> > > > > 没有英伟达显卡有办法用吗 > > > > > > > > > > > > 没有显卡的话就用 Cpu 啦,会慢一点。 > > > > > > > > >...

``character_dict.pkl``存的是字符,``Chinese_content.pkl``存的是字符对应的标准图像,``writer_dict.pkl``存的是书写者id和对应的顺序映射

跟文件名应该没关系,可以试试对裁剪出来的图片做个简单的二值化处理,应该能提升效果https://github.com/dailenson/SDT/issues/59#issuecomment-1963233481

微软雅黑是标准字体,我们这个都是在手写体上训练的,domain gap会有点大... 不过看生成你生成的结果,至少字符的倾斜程度好像学的还可以哈哈哈

> 我的猜测是这样的:你的图片如果是手写的,那么实际上可能有很多那种小的噪点,毕竟白纸细看也不是完全光滑完全白的,你用加亮之类的也会有个度,终究会有不少噪点留下来 我的实际测试是我拿iPad写的16个字没有纸质写的同样16个字那么狂草,正常人基本都能看得懂 能把生成结果贴出来看下嘛?

> > > 能把生成结果贴出来看下嘛? > > > 这个是纸上写的数据集生成的 > > > ![吖](https://private-user-images.githubusercontent.com/83990760/307648255-3c4f74e1-954e-44c7-a9c0-5cd5c53318e8.png?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTUiLCJleHAiOjE3MDg5MTU4NzcsIm5iZiI6MTcwODkxNTU3NywicGF0aCI6Ii84Mzk5MDc2MC8zMDc2NDgyNTUtM2M0Zjc0ZTEtOTU0ZS00NGM3LWE5YzAtNWNkNWM1MzMxOGU4LnBuZz9YLUFtei1BbGdvcml0aG09QVdTNC1ITUFDLVNIQTI1NiZYLUFtei1DcmVkZW50aWFsPUFLSUFWQ09EWUxTQTUzUFFLNFpBJTJGMjAyNDAyMjYlMkZ1cy1lYXN0LTElMkZzMyUyRmF3czRfcmVxdWVzdCZYLUFtei1EYXRlPTIwMjQwMjI2VDAyNDYxN1omWC1BbXotRXhwaXJlcz0zMDAmWC1BbXotU2lnbmF0dXJlPWE0ZTQ1NWQ5NDAyMzBjYmEyZjI5NTEzNjJmM2ZmNDY1ZTMyMGYwNzA1ZjQ1NmIyNTRiZDg1Yzk5MTM2NmZjMzMmWC1BbXotU2lnbmVkSGVhZGVycz1ob3N0JmFjdG9yX2lkPTAma2V5X2lkPTAmcmVwb19pZD0wIn0.OtlMypKDdfn0zuKfNMTX6dREHJsCO74cI4NDbii49eo) > > > 这个是iPad写的生成的 > > > ![吖](https://private-user-images.githubusercontent.com/83990760/307648408-1f915cf3-8334-40de-b117-1e647db973e7.png?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTUiLCJleHAiOjE3MDg5MTU4NzcsIm5iZiI6MTcwODkxNTU3NywicGF0aCI6Ii84Mzk5MDc2MC8zMDc2NDg0MDgtMWY5MTVjZjMtODMzNC00MGRlLWIxMTctMWU2NDdkYjk3M2U3LnBuZz9YLUFtei1BbGdvcml0aG09QVdTNC1ITUFDLVNIQTI1NiZYLUFtei1DcmVkZW50aWFsPUFLSUFWQ09EWUxTQTUzUFFLNFpBJTJGMjAyNDAyMjYlMkZ1cy1lYXN0LTElMkZzMyUyRmF3czRfcmVxdWVzdCZYLUFtei1EYXRlPTIwMjQwMjI2VDAyNDYxN1omWC1BbXotRXhwaXJlcz0zMDAmWC1BbXotU2lnbmF0dXJlPWRlYmNkZGJjMzdiN2ViYzMyZjJjOWZmODk1ZjBlYjk5M2E1NzIzYzdhOTU3MTExMzIxZmIzMmQwOWZmYmJlZGYmWC1BbXotU2lnbmVkSGVhZGVycz1ob3N0JmFjdG9yX2lkPTAma2V5X2lkPTAmcmVwb19pZD0wIn0.RsvrgLmnCDDo72sZn4MAFzFOk41vAvImjoZBG0p5Oow) 那感觉将纸上写的字拍照后,做个简单的二值化处理后再输入模型中,应该能缓解“狂草”问题

可以看下这位老铁的复现结果https://github.com/dailenson/SDT/issues/75#issuecomment-2031897517

感谢您的建议~后期我们会考虑把项目发布在hugging face上