WANGJUNJIE
WANGJUNJIE
> **[wtkszzz](/wtkszzz) ** commented [1小时前](#issuecomment-991831019) 完全没有。。。 我依然不知道如何把这玩意处理成0000001.jpg这种形式。。 I still do not know how to process the images into the formats like 0000001.jpg... And I do not how to check my...
> wtkszzz 我还没下载好。好多链接有问题。 而且没办法在国内下载。
> 同学你好,作者在描述CC和SBU的时候, root ├── images_train │ ├── 0000 # First four letters of image name │ │ ├── 0000000 # Image Binary │ │ ├── 0000001 │ │ └── ......
Can the parameters of "large-upload" be aligned to the "upload"? huggingface-cli large-upload [repo_id] [local_path]
> @wanng-ide Agree we should aim for consistency yes. What parameters/options you would specifically change? > > So far we have: > > ```shell > $ huggingface-cli large-upload --help >...
这个是pdf中的表格的问题,以前我用开源工具提取pdf语料时没注意表格这个特殊的分类。不过,这个确实是一个非常重要的数据结果,不能直接这样划分开。以后我们多模态组特别对表格数据进行处理。那个时候会对这个工具进行翻新。非常感谢您的建议。