ginza Auto parameter optimization option for multi-GPU environment

Auto parameter optimization option for multi-GPU environment

Open hiroshi-matsuda-rit opened this issue 3 years ago • 0 comments

次の条件から、従来型のtok2vecモデルとtransformersモデルとで異なるマルチプロセス戦略を取りたい。

モデルと利用可能なGPU数との組み合わせで類型化してみます。

GPUなし
- tok2vec
  - マルチプロセス化によりほぼリニアに高速化が可能
  - Many Core CPUでは並列度はメモリで律速される場合がある
- transformers
  - 独自のマルチプロセス化により2倍程度は高速化可能
GPU1台
- tok2vec
  - 並列度はGPU処理帯域で律速 = 4並列程度が限界 = CPU単一プロセスの8倍程度が限界
  - CPUが8コア以上の場合はGPUを用いないマルチプロセス化の方が効果が高い
  - GPUマシンのCPUコア数は普通はもっと多いものを使うことが多い
- transformers
  - 並列度はGPU処理帯域またはGPUメモリ容量で律速 = 5並列程度が限界
GPU2台以上
- tok2vec
  - CPUコア数 >= 8 x GPU台数の場合はGPUを用いないマルチプロセス化の方が効果が高い
- transformers
  - 並列度はGPU台数 x 5またはCPUコア数のいずれかで律速

上記をふまえて、現在のマルチプロセスオプションに加えて、さらに次の機能の追加を検討したいと思います。

一方、上記のような複雑なパラメータの組み合わせをユーザが使い分けることはかなり難しいため、利用中の環境に応じて適切に並列処理パラメータを自動設定するモードも検討したいと思います。

Oct 15 '21 16:10 hiroshi-matsuda-rit