Rocky LinuxとRadeon Instinct MI25でROCmを使う②冷却編

Radeon Instinct MI25ですが、GPUはパッシブクーラーがついています。
そのため、FANはついておらずケース内のエアフローで何とかする必要があります。

自作PCで300WのGPUを冷やしきるほどのエアフローは確保できないので、FANをつけて冷やします。

以下のサイトで公開されていたMI25に80mm FANをつけるシュラウドが公開されていたので、これを3Dプリンタで印刷します。
https://www.printables.com/model/474616-radeon-instinct-mi25-80mm-fan-mount-case

80mmFANは山洋電気F8-PWMを使用しました。また、MI25から電源を取るのに変換ケーブルを使いました。
→F8-S15PWMにFANを交換しました。厚みが少なく、静圧が高めです。

それを合体すると以下のようになります。だいたい3スロット厚になるので、PCIe x16が3スロット以上空いてるマザーボードだと2枚搭載できます。

ケースはDefine-Cを使用しました。

サポートステイをつけつつ、以下のようになります。1枚目はちょっと窒息気味なので温度が高めになります。

これで自宅に24.58TFLOPS×2の計算リソースを置くことができます。しかもHBM2で32GBのメモリもあります。

ただし、推論をちょっと動かした程度で、学習のロングランでは評価できてないのですが、学習で10分程度動かすと以下のような感じになって、100W制限をかけてもあまり冷やしきれてない感があります。

========================= ROCm System Management Interface =========================
=================================== Concise Info ===================================
GPU[0]          : get_power_avg, Not supported on the given system
GPU[1]          : get_power_avg, Not supported on the given system
GPU  Temp (DieEdge)  AvgPwr  SCLK    MCLK    Fan     Perf  PwrCap  VRAM%  GPU%
0    84.0c           N/A     852Mhz  167Mhz  30.98%  auto  100.0W   24%   99%
1    80.0c           N/A     991Mhz  500Mhz  36.86%  auto  100.0W   14%   99%
====================================================================================
=============================== End of ROCm SMI Log ================================

ちなみにですが、オーバーヒートするとかなりの大音量でビープがなります。そういった意味でもこの構成で長時間動かすのはやめたほうがいいです。

MI25ですが、オークションで入手しましたが、1枚4千円程度で入手できたので、面倒事も多い玄人向けなところはありますが、ビデオメモリが欲しい用途ではアリかなと思っています。ただし、複数枚はあんまりおすすめはしません。

正直2枚使ってのLLMの性能はうまく引き出せていないので、1枚で45TFLOPSで16GBあるRX 7600XTとか、122.8 TFLOPSで24GBのRX 7900XTXとか試してみたいですよね。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)