OpenGait icon indicating copy to clipboard operation
OpenGait copied to clipboard

在opengait上使用单卡训练步态识别的模型时,得到的准确率全是2%,这是怎么回事呢?

Open heyihao2018 opened this issue 1 year ago • 4 comments

大家好,在我复现opengait的gaitset代码时,因为我用的是单卡,所以我把分布式相关的代码都注释掉了,我个人觉得训练过程应该是没有问题的,最可能出现问题的是我用的windows系统,这是否会有影响,以及测试的代码是否存在小问题,如果有人也出现过这个问题,请大家告诉我,我自己也会慢慢琢磨的,谢谢大家!

heyihao2018 avatar Jul 27 '24 03:07 heyihao2018

和系统关系不大,win和linux都复现过,单卡需要调整参数

world1987 avatar Aug 07 '24 03:08 world1987

单卡可以不用改动代码,直接改动train和test的命令即可,CUDA_VISBLE_DEVICES改成0,nproc_per_node改成1

wj1tr0y avatar Aug 11 '24 15:08 wj1tr0y

你好,请问这个问题你解决了吗

JJ-Luov avatar Sep 12 '24 08:09 JJ-Luov

def ddp_all_gather(features, dim=0, requires_grad=False):
    '''
        inputs: [n, ...]
    '''

    world_size = 1
    rank = 0
    feature_list = [features for _ in range(world_size)]
    if requires_grad:
        feature_list[rank] = features
    feature = torch.cat(feature_list, dim=dim)
    return feature

我把lib/utils/common.py文件里面的这个函数改了改,就可以了

heyihao2018 avatar Sep 18 '24 09:09 heyihao2018

您好,请问您的问题解决了吗?我也遇到了类似的问题,想参考前辈。我在Linux系统上用单卡和双卡都试过了,训练结果都只有2%左右的rank1,我没有改动代码,只改动了.yaml文件里的参数。目前我找不到问题在哪里了

yyj-001 avatar Nov 11 '24 09:11 yyj-001

你好,我把网络换成gaitset能收敛,10000次迭代rank1能到百分之九十多,具体也不知道是哪里的问题  

J. X J. @.***

 

------------------ 原始邮件 ------------------ 发件人: @.>; 发送时间: 2024年11月11日(星期一) 下午5:22 收件人: @.>; 抄送: @.>; @.>; 主题: Re: [ShiqiYu/OpenGait] 在opengait上使用单卡训练步态识别的模型时,得到的准确率全是2%,这是怎么回事呢? (Issue #234)

您好,请问您的问题解决了吗?我也遇到了类似的问题,想参考前辈。我在Linux系统上用单卡和双卡都试过了,训练结果都只有2%左右的rank1,我没有改动代码,只改动了.yaml文件里的参数。目前我找不到问题在哪里了

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you commented.Message ID: @.***>

JJ-Luov avatar Nov 11 '24 09:11 JJ-Luov

Stale issue message

github-actions[bot] avatar Jan 11 '25 07:01 github-actions[bot]