そこそこの投資をして、新型のGPUであるGeForce RTX 2080 Tiを四枚積んだ水冷サーバを購入しました。

クラウド全盛の今ですが、やっぱり手元にハードウェアを置いて使い倒すそのことにも意味があると思うのです。

GAFAM と呼ばれる現代IT界の巨人たちは、みな自前のデータセンターに巨額の投資を行っています。彼らはクラウド業者ではありますが、ただのサーバ貸し屋かと言えばそんなことはなくて、むしろその巨大なハードウェアリソースに裏打ちされた世界規模のサービスを展開し、ディジタル世界で圧倒的な地位を占めています。

データを制するものは世界を制すと言われますが、データの入れ物と、データを解析するコンピューティングリソースと、データを集める仕組みを併せ持つものが勝者になっているように感じるのです。

だからやっぱりハードウェア持たないと!そういう言い訳です。欲しかったんです笑。


現在の機械学習というのは、とにかくコンピューティングリソースを必要とします。ディープラーニングに代表される特徴量の多いモデルを大量のデータから学習するために時間がかかること、ハイパーパラメータの多くがトライアンドエラーによって決まることが理由です。有限の時間の中でどれだけ学習サイクルを回せるかが、成果を出す大きなポイントになってくるのです。

本来は画像演算用だったGPUを、一般演算に応用するGPGPU技術が普及し、特にディープラーニングではGPUを使った学習が一般的になっています。できれば速いGPUを、できれば複数枚使って効率をあげたい。特殊な設計で数千万円以上もするようなGPUクラスタは別ですが、今回はアキバで手に入る構成としては最強に近い構成にトライしてみました。

200Vの電源を配線したりでなかなか大変だったのですが、ひとまずOSやミドルウェアのインストールを終えて、無事に動いているようです。

|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce RTX 208...  Off  | 00000000:19:00.0 Off |                  N/A |
|  0%   31C    P0    56W / 260W |      0MiB / 10989MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
|   1  GeForce RTX 208...  Off  | 00000000:1A:00.0 Off |                  N/A |
|  0%   30C    P0    68W / 260W |      0MiB / 10989MiB |      1%      Default |
+-------------------------------+----------------------+----------------------+
|   2  GeForce RTX 208...  Off  | 00000000:67:00.0 Off |                  N/A |
|  0%   30C    P0    49W / 260W |      0MiB / 10989MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
|   3  GeForce RTX 208...  Off  | 00000000:68:00.0 Off |                  N/A |
|  0%   30C    P0     1W / 260W |      0MiB / 10986MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
                                          
四枚目のGPUだけ3MiBメモリが少ない。GPUのメモリは例えば同じ1080Tiでも微妙に量が違ってなんとなく気になってたのだけど、今回は2080Tiで完全に型番の同じボードでも違う。(理由不明)

使ってみるとさすが水冷機。空冷だと二枚挿しで回すと80℃に達するGPUの温度が四枚をフル稼働させても60℃程度で落ち着いています。これからいっぱい使ってあげようと思います。