sbv2-api icon indicating copy to clipboard operation
sbv2-api copied to clipboard

Python版のcuda対応に関すること

Open tuna2134 opened this issue 1 year ago • 5 comments

機能追加の説明 GPUとかで動かしたいって方がいるので、その対応としてdynamicを提案する

メリット dynamicにすることでcuda以外でも使える

デメリット ユーザーの負担が増える

tuna2134 avatar Oct 18 '24 15:10 tuna2134

すみません失礼します GPUで、もしonnx cudaのstyle ber vits2音声合成をしたら、GPUメモリは.safetensorの音声合成に比べて必要なGPUメモリはどれくらい節約できるとおもいますか? onnx gpuのメモリ節約効果について

Mofa-Xingche avatar Nov 06 '24 02:11 Mofa-Xingche

実際に計測しないことにはわかりませんが、動的にslotを読み込んだりアンロードする負荷は間違いなく低いため、slotの読み込み上限を付けることで結果的に複数モデル扱うときのVRAM節約をすることはできるはずです。

googlefan256 avatar Nov 06 '24 06:11 googlefan256

そこらへんの実装をすることにしました(python版ではなくdocker版に) 同時にGPUに読み込むモデルに上限を付けることでメモリを節約できる機能です。 公式版と比べてGPUとCPU間の転送コストが低いため、高速に行えるはずです。

googlefan256 avatar Nov 06 '24 06:11 googlefan256

そこらへんの実装をすることにしました(python版ではなくdocker版に) 同時にGPUに読み込むモデルに上限を付けることでメモリを節約できる機能です。 公式版と比べてGPUとCPU間の転送コストが低いため、高速に行えるはずです。

python版にも実装できそうです

googlefan256 avatar Nov 06 '24 06:11 googlefan256

ありがとうございます。><

Mofa-Xingche avatar Nov 06 '24 06:11 Mofa-Xingche