GPT-SoVITS
GPT-SoVITS copied to clipboard
CMP系列显卡需要禁用半精度
实测NVIDIA CMP 30HX和NVIDIA CMP 40HX无法生成音频。据说cmp系列显卡(矿卡)被阉割了半精度算力,我在config.py添加两处,识别cmp系显卡,不使用半精度。现在能成功生成音频了
is_16_series = bool(re.search(r"16\d{2}", name)) and sm_version == 7.5
is_cmp_series = "CMP" in name.upper() # ✅ 新增 CMP 检查
if mem_gb < 4 or sm_version < 5.3:
return cpu, torch.float32, 0.0, 0.0
if sm_version == 6.1 or is_16_series == True or is_cmp_series == True: # ✅ CMP 不使用半精度
return cuda, torch.float32, sm_version, mem_gb
是矿卡全砍了吗,还是就这两款?
我在贴吧看到是这么说:
这里纠正一下大家对于cmp矿卡到底阉割了什么的认识: p系的矿卡p106 p104 p102只阉割了PCIe带宽,对,没错,关于什么半精度双精度,因为10系像1080ti还是p40本来就没有什么半精度和双精度(p100除外),本来就没有的东西,不能叫做阉割 然后是hx系列的矿卡,首先是tensor core张量核心全部阉割,然后是目前大家熟知的就是30hx 40hx补电容到x16可以打游戏,其实50hx 90hx 170hx也可以补x16,不过也还都是PCIe1.1。重点来了,50hx 90hx 170hx阉割了所有fp浮点性能,对,你没看错,是所有浮点性能全都没有(包括半精度单精度双精度),只保留了整数int算力,因为挖矿所用到的哈希hx算法,依靠的就是整数算力。所以说,50hx 90hx游戏性能很差很差,170hx本来就不能打游戏。
https://tieba.baidu.com/p/9657490851
问题可能在FMA这块,CMP系列阉割了FMA指令集 P系列有有限的FP16半精度能力【P100除外】,不是没有,真没有纯靠升格成FP32软件模拟的是M系列