sisrfeng

Results 155 comments of sisrfeng

请问这个错误是因为imageNet数据集的结构不对吗? ![image](https://user-images.githubusercontent.com/53520949/156909197-89c2e24e-04ef-4299-b5f7-d675fb84ee75.png) 数据集从这里下载的: https://www.kaggle.com/c/imagenet-object-localization-challenge/data?select=imagenet_object_localization_patched2019.tar.gz ![image](https://user-images.githubusercontent.com/53520949/156909314-d439825d-6902-44f8-a25f-158367eaf01c.png) 结构: ![image](https://user-images.githubusercontent.com/53520949/156909125-0a7fd7a3-ada7-47b0-8a06-66e7eb32da4e.png) ![image](https://user-images.githubusercontent.com/53520949/156909242-6d39b220-60a1-4b5f-a683-2cdc4c512759.png) ![image](https://user-images.githubusercontent.com/53520949/156909250-33c42209-9729-408b-9c0a-f79b73aba78e.png) ![image](https://user-images.githubusercontent.com/53520949/156909263-ece97087-9bac-4250-85db-e5a8260cb38c.png) (如果val下不多建一级val, 会报错, 说找不到图片啥的) 这几个文件, 除了pipeline.log, 都是空的 ![image](https://user-images.githubusercontent.com/53520949/156909216-00cb06a1-fdf1-4bd8-96b8-4bc866ecf331.png)

这个问题解决了, `FileNotFoundError: [Errno 2] 没有那个文件或目录: '/data/wf/e/tasks/12_17日13时29分_11月/workers/serial/1/model_1.pth' ` 没记错的话, 解决方法是: 在val下多建一级val, ![image](https://user-images.githubusercontent.com/53520949/158019554-dd161f0f-442e-4eb7-af7f-fdfdec63dd74.png) 现在能找到serial下的model1.pth等 ![image](https://user-images.githubusercontent.com/53520949/158019597-be45a495-724f-46b9-813d-867257d9634b.png) 中文目录: 这是因为我改过conda环境里的源码, ( 原来的日期, 一堆数字, 不好辨认)

现在这个问题怎么搞呢? ![image](https://user-images.githubusercontent.com/53520949/158019663-e97e6138-e856-43ee-90c1-6d9c622cf1c7.png)

谢谢! 请问这里的prerequirement, 没指定版本的话, 最好是安装最新的stable版嘛? (我的ubuntu是20.04) ![image](https://user-images.githubusercontent.com/53520949/158089851-7474f581-0a00-4331-b701-6c65e54d212c.png)

我用python3.9.7 装的是最新的stable版: conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch 无论是否修改这里: anaconda3/envs/py39_torch111/lib/python3.9/site-packages/vega/networks/faster_rcnn.py ![image](https://user-images.githubusercontent.com/53520949/159113500-24c70fdd-e2ff-455f-adca-04b373118a2d.png) 都是一样的错误. ![image](https://user-images.githubusercontent.com/53520949/159602562-bfd6aebf-49be-44d7-88b1-1fb8872d16ce.png) 请问怎么解决呢?

`conda create --name py39_torch1_8_0 python==3.9` `conda install pytorch==1.8.0 torchvision==0.9.0 torchaudio==0.8.0 cudatoolkit=11.1 -c pytorch -c conda-forge` 没改vega代码, 还是出错: ![image](https://user-images.githubusercontent.com/53520949/159602695-1cf662ea-3581-451c-bd9a-868277efc15a.png) 跟ImageNet的目录结构有关吗? > 请问这个错误是因为imageNet数据集的结构不对吗? ![image](https://user-images.githubusercontent.com/53520949/156909197-89c2e24e-04ef-4299-b5f7-d675fb84ee75.png) > > 数据集从这里下载的: https://www.kaggle.com/c/imagenet-object-localization-challenge/data?select=imagenet_object_localization_patched2019.tar.gz ![image](https://user-images.githubusercontent.com/53520949/156909314-d439825d-6902-44f8-a25f-158367eaf01c.png) > > 结构:...

谢谢~ 1. 我用的确实是coco2017, 之前跑过CenterNet等模型, 没有出现问题 2. ImageNet现在应该是把数据放到Kaggle托管了, 我从ImageNet官网的链接跳过去的. 下载的文件, 有val和train目录. train目录下还有目录, val下却没有再分目录, 所有图片混在一起. 应该是这原因 导致了下面这个问题: FileNotFoundError: [Errno 2] 没有那个文件或目录: '/data/wf/e/tasks/12_17日13时29分_11月/workers/serial/1/model_1.pth' 我的解决方法是: 在val下多建一级val 请问你们在实验时, 有这么处理吗? 关于这个错误: ![image](https://user-images.githubusercontent.com/53520949/160049143-6d5074ad-e6b0-407b-8160-c4c06be59f86.png) 我找到的线索: ![image](https://user-images.githubusercontent.com/53520949/160044698-2e3a056f-0ba9-4ac3-a99d-ba899e90f0df.png) ![image](https://user-images.githubusercontent.com/53520949/160045160-ba2dd88e-9357-459f-883b-25c15f526312.png) ![image](https://user-images.githubusercontent.com/53520949/160045145-88718551-622e-43c7-a9bc-6f4f93e3321f.png)...

好的, 我重新跑一下. `val/n01797xxx/xxx.jpeg` 这是从ImageNet官网下载后, 根据gt自己划分的吗?

再请教下log的问题: log的level还没到debug, 就已经这么多记录了: ![image](https://user-images.githubusercontent.com/53520949/160141533-f1f82162-c8f7-4809-8ed5-16693fd08dd1.png) 你们是怎么从中找到有用的信息的呢? 训练时每次迭代的记录太多了, 没有缩进, 不能在vim或者vscode里按缩进折叠, 太难翻了.

tasks/目录: [tmp_at_home.zip](https://github.com/huawei-noah/vega/files/8362017/tmp_at_home.zip) 还是到了parallel阶段报错:Tuple啥的 我把官方的yml文件的一些参数改小了, (不然太慢了:)