Open-Sora
Open-Sora copied to clipboard
2080ti咋玩,模型T5 加载一半显存就炸了
为何开了sequence parallelism 但是每张卡还需要单独加载整个T5语言模型? 开了8卡也同样炸显存。。。。