caixiiaoyang
caixiiaoyang
> """要使用调试信息进行构建,请添加标志 --bazel_options='--copt=/Z7'。""" FROM https://jax.readthedocs.io/en/latest/developer.html#id1 不过这个是基于最新的openxla的回答了,这个不确定0.3.22的能不能用 btw,可以加个vx交流一下吗老哥 可以,我的微信号是13140163867
> I also met this issue when trying to use `alpa.ShardParallel()` or `alpa.PipeshardParallel()` to auto parallelize my llama model. > > data:image/s3,"s3://crabby-images/5be7b/5be7bab0f7db051b0e52762c956366ca5249e9e4" alt="image" I also encountered this problem in the process...
I encountered the same problem, has your problem been solved?
请问您的问题解决了吗我的也出现了这个问题
你有几张卡,num_stages默认是2,你的num_devices不能整除num_satges就会出现这个问题,最好保证num_devices为偶数
> > 你有几张卡,num_stages默认是2,你的num_devices不能整除num_satges就会出现这个问题,最好保证num_devices为偶数 > > 我的服务器上有5张卡,如下图 data:image/s3,"s3://crabby-images/c9215/c9215ad868a37d8cc1036ba4cea4828a31a9564c" alt="image" > > 我应该怎么修改num_devices的数量,当我尝试输入CUDA_VISIBLE_DEVICES=0,1 python3 -m alpa.test_install,还是会有相同的问题 我不知道怎么修改卡的数目,你有五张卡,并且卡的型号也不一样,你在a100上编译的,在3090上运行可能会出问题
请问您解决了吗,我也出现了这个错误
> i can not train yolov5 with your code ,report error ' ValueError: Target size (torch.Size([16, 1200, 1])) must be the same as input size (torch.Size([16, 17000, 1]))',it seems that...