qw1319
qw1319
nni.common.serializer.PayloadTooLarge: Pickle too large when trying to dump . This might be caused by classes that are not decorated by @nni.trace. Another option is to force bytes pickling and try...
这个问题有解决吗?这边直接运行也看到gpu_offload未提前加载权重 第一步:报错没有activation文件夹;  这边手动增加activation文件夹(fake)后,执行python依然报错 
我遇到和你一样的问题 a100使用系数模型 性能比原始模型还要差很多,测试模型为relullama2-7b
这边同样用a100运行生成的promat貌似是错的  同样用cpu跑的结果是正常的  是否cuda代码不严谨,触发了a100 arch的bug?