Hanat
Hanat
这个指的是一个文本串生成的字的个数吗?如果是的话,只需要改config.yml里的len_range就可以了,这个是文本串的长度控制的参数的。如果指的是生成的总文本串的个数,那么这个我们是没有做统计的,一般我们会定个count_per_process(每个进程下生成图片的个数),和process_count(进程数)数,然后做生成结束后统计一下,或者是看output/label_data/下的文件数
我们生成了lsvt 格式的数据集,里面包含每个字的位置和一行字的内容,具体代码在service/base.py,你也可以仿照写一个生成数据的格式,主要是如果多进程的话,你需要做一个多进程每个进程生成的json 合并的脚本(如果你已经写好了生成coco数据格式的方法的话)
> Yeah... The error seems to be from **DGLIBCXX_USE_CXX11_ABI OFF for PyTorch**, so we **CANNOT** turn **ON DGLIBCXX_USE_CXX11_ABI** while building **Open3D-0.18.0**. > > ``` > CMake Error at 3rdparty/cmake/FindPytorch.cmake:108 (message):...
I'm facing the same problem, Can you open a registration entry? (I can't find registration entry. Also, I need this dataset in research purpose~), Waiting for your reply~ Thank you
> @BboyHanat do you have any progress? I think this repo is a solution to collect required data [OnePoseDatasetCollector](https://github.com/siatheindochinese/OnePoseDatasetCollector)
主要修改 service/provider/TextProvider.py中的 类 RandomCorpusGen, https://github.com/BboyHanat/TextGenerator/blob/master/service/provider/TextProvider.py#L51 修改这个方法里的 _random_crop,_random_add(是为了控制生成的长度在限制范围内, 长了随机crop一些,短了随机在添加 一点), 还有关闭randomshuffle(这个提高生成的随机性),修改这些应该能满足你的要求,还有就是在config.yaml中设置random_character的probability=0