FKCHAN

Results 8 comments of FKCHAN

--train : python3 main.py train --dataset=Patio_Lawn_and_Garden_data --model=DAML --num_fea=1 --output=fm --error euclidean = (user_local_fea - item_local_fea.permute(0, 1, 3, 2)).pow(2).sum(1).sqrt() RuntimeError: CUDA out of memory. Tried to allocate 5.94 GiB (GPU 0;...

恩,谢谢大佬回信,我改好batch_size可以运行了 2080ti 11g 运行太慢了,想用三块一起跑,但是模型保存出错,这部分应该怎么解决呢?我把这个问题提到另一个DAML的issues里了 在2020年12月23日 14:33,HT Liu 写道: @yinzhiqiangluvlzx 你好, 我刚刚测试下,没有问题;我的训练代码: python3 main.py train --model=DAML --num_fea=2 --batch_size=16 测试脚本为: python3 main.py test --model=DAML --num_fea=2 --batch_size=16 --pth_path='./checkpoints/DAML_Digital_Music_data_defau lt.pth' 看报错信息应该是你那边一些参数没有修改,导致训练和测试不一致。 — You are...

好的,那我就先一边训练一遍测试了,期待中,大佬加油,fighting! 在2020年12月23日 14:41,HT Liu 写道: @FKCHAN 在那个issue里面已经提到, 多卡模型的save与单卡有点不同, https://pytorch.org/tutorials/beginner/saving_loading_models.html#saving-torch-nn-dataparallel-models 后期的计划, 用pytorch-lightning 包装下模型,更好更简单的支持并行训练。 预计春节前做。 — You are receiving this because you were mentioned. Reply to this email directly, view it on...

你好,因为跑不起来,所以用了三块显卡并行,但是保存模型的时候报错了, AttributeError: 'DataParallel' object has no attribute 'save'

> > > it is resolved, thanks I also have this problem here. I have tried many methods and failed. Can you share the generated files? Thank you!

i run the *.cpp file on ubuntu16.04 ,and then get the correct result without any problem,so i guess the reason why we faild is the environment. On 5/18/2020 11:24,gxw928 wrote:...

您好,是否也可以分享給我一份對比模型的代碼?我的邮箱是[email protected],感謝您

> 我用python3.5 然后TensorFlow,他的版本比较低,但是具体语法自己改改就行,比如我的是1.2.1的TensorFlow,具体改动参考[facingwaller@f82ff75](https://github.com/facingwaller/irgan/commit/f82ff75ed3b9be535b0918fe5ed68168e6bfd8ff。据我了解没用到keras。) 嗯嗯 谢谢啦! 3.5 qa部分已经完美运行tensor没太多的要求 改改函数就可以了 再次感谢