pangedeshijie

Results 7 comments of pangedeshijie

@ziyang599 请教一下,3个PS时,model_dir 是不是只能指定hdfs目录呀,我指定了本地的同名目录,结果有错误,指定hdfs目录需要配置什么呀,目录格式是什么呢? 感谢解答!

@lixusign @a370865882 请教一下,3个PS时,model_dir 是不是只能指定hdfs目录呀,我指定了本地的同名目录,结果有错误,指定hdfs目录需要配置什么呀,目录格式是什么呢? 感谢解答!

> 不是hdfs没设置上,就是你的hdfs路径不正确,目录格式可以在代码里找到 没找见Euler的路径, 我的路径是 hdfs://ip:host/mylibraby ,请问应该是这样的格式吗? 没用过分布式的东西,抱歉!

@jackonan Thank you very much for your reply. Currently, HDFS is not supported, **how can I use multiple PS?** My embedding can't be saved with a PS.

哥们,很感谢你提供的解决方案,这个common.py是修改完后,需要重新训练一下模型吗?还是在导出为onnx的时候修改?

> 我也遇到了相同的问题,可视化发现concat和reshape算子那边有点问题,onnxruntime测试也是,最后定位在common.py的channel_shuffle这边,需要把batch_size设置为-1,其他对应修改就可以了。 哥们,很感谢你提供的解决方案,这个common.py是修改完后,需要重新训练一下模型吗?还是在导出为onnx的时候修改?

def channel_shuffle(x, groups): batchsize, num_channels, height, width = x.data.size() channels_per_group = num_channels // groups batchsize = -1 # reshape x = x.view(batchsize, groups, channels_per_group, height, width) x = torch.transpose(x, 1,...