AlphaNext
AlphaNext
> 你是怎么安装sat的,直接pipinstall 最新的试试呢,这个是在运行代码的时候报错的,sat版本是0.4.12吗 @zRzRzRzRzRzRzR sat 直接安装的requirements.txt里的那个版本,是0.4.12,这应该是最新版本的sat,是在运行代码报错的。
> 应该是你cuda和torch 没有完全匹配,我刚才cuda 11.5就出现跟你一个错误,虽然你写的是12.2,但是确保你的torch 和cuda 已经compile 我换成cuda12.2就正常了 cuda和Torch是匹配的,还试了torch2.4.0, cuda11.8的还是会有这种问题 下面这个环境验证的输出: ``` >>> import torch >>> print(torch.__version__) 2.4.0+cu121 >>> >>> print(torch.cuda.is_available()) True >>> exit() ```
> 那只能注释掉所有有关ema的部分了,因为只有可能是因为torch cuda cudnn没对上,其他情况不应该出现这个问题 > > 你试试你能不能 from torch.cuda.amp import autocast 如果不行大概率就是环境设置问题 在哪块加这句代码?另外你上面测试的是哪个commit id的代码
> 那只能注释掉所有有关ema的部分了,因为只有可能是因为torch cuda cudnn没对上,其他情况不应该出现这个问题 > > 你试试你能不能 from torch.cuda.amp import autocast 如果不行大概率就是环境设置问题 ``` Type "help", "copyright", "credits" or "license" for more information. >>> import torch >>> from torch.cuda.amp import autocast...
> > > 那只能注释掉所有有关ema的部分了,因为只有可能是因为torch cuda cudnn没对上,其他情况不应该出现这个问题 > > > 你试试你能不能 from torch.cuda.amp import autocast 如果不行大概率就是环境设置问题 > > > > > > 在哪块加这句代码?另外你上面测试的是哪个commit id的代码· > > 现在的main分支 [3fb5631](https://github.com/THUDM/CogVideo/commit/3fb5631b7651e5cc5d83b4aad9bd008da15c6040) 解决了,很有可能是cuda的有些东西对GCC有依赖,比如:cuda-compiler、cuda-nvcc,更新GCC需要把原来的GCC完全清理,我只是新安装了GCC11,并改了GCC的软连接,不过用下面这种方式即可解决: ``` $...
> Hi, guys, we may have the same problem. Add a wechat? maybe the learning rate is larger, the default lr is 0.001 ``` # configs/sft.yaml # Between 1E-3 and...
> > > Hi, guys, we may have the same problem. Add a wechat? > > > > > > maybe the learning rate is larger, the default lr is...
> pip install -v --disable-pip-version-check --no-cache-dir --no-build-isolation --config-settings "--build-option=--cpp_ext" --config-settings "--build-option=--cuda_ext" ./ @COST-97 好像不太管用,新版本的编译直接出现: ``` Building wheel for apex (pyproject.toml): finished with status 'error' ERROR: Failed building wheel for apex...
@yjhong89 Hi, have a simple question, how to prepare dataset for image to video (I2V) fine-tuning, thanks.