zyc
zyc
这个地方是对latent的有文本部分进行优化,然后用损失Ltransfer去逼近注意力点平均分布吗
好嘞,感谢您的解答,我已理解,谢谢!
发生异常: RuntimeError CUDA error: invalid argument CUDA kernel errors might be asynchronously reported at some other API call, so the stacktrace below might be incorrect. For debugging consider passing CUDA_LAUNCH_BLOCKING=1....
目前没有改动代码,我使用了我自己的数据集,总共20各类别,我先使用预训练好的resnet,fc输出已改成20,不知道是啥情况,是不是跟torch版本有关,我从网上没找到解决办法,使用cpu跑就没问题
感谢您的回复,第一个问题我已经解决,就是第二个问题,我没在imagenet上跑,我是在自己的私有数据集上跑出现的这个问题 ---- 回复的原邮件 ---- | 发件人 | ***@***.***> | | 日期 | 2025年06月12日 23:57 | | 收件人 | ***@***.***> | | 抄送至 | Hongbing ***@***.***>***@***.***> | | 主题 | Re:...
您好,cross前后就是热力图的变化,感觉变化不明显,按照原文的内容和图2的cross attention变化前后的图热力图应该是平均分散的,但是我跑出来的没啥变化 ---- 回复的原邮件 ---- | 发件人 | ***@***.***> | | 日期 | 2025年06月13日 03:22 | | 收件人 | ***@***.***> | | 抄送至 | Hongbing ***@***.***>***@***.***> | | 主题 |...
增加了10倍还是不行,会不会是因为文字描述部分,因为文本编码器会把文字分开,分开之后语义发生了变化,比如“xxx airplane”,这个xxx是好多种修饰词,造成stable diffusion无法正确定位 ---- 回复的原邮件 ---- | 发件人 | ***@***.***> | | 发送日期 | 2025年6月13日 14:52 | | 收件人 | ***@***.***> | | 抄送人 | Hongbing ***@***.***>, ***@***.***> | |...
好的谢谢您,我微调一下stable diffusion试试,您说的我修改后有一定提升