Gemma 4をllama.cppでベンチ（CUDAとVulkanの差も見てみる）

Gemma 4がリリースされて以降、ローカルLLM界隈がまた少し活気づいてきた印象があります。
特に今回のモデルは、システムプロンプトへの追従性がかなり良く、ロールプレイや指示の一貫性が崩れにくい点が目立ちます。

さらに、Apache Licenseで公開されていることもあり、商用利用や組み込み用途でも扱いやすく、「手元で動かす前提のモデル」としての魅力が一段と増しています。

そうした流れもあり、実際の性能がどの程度出るのか気になってきたので、今回はllama.cppを使っていくつかの構成でベンチマークを取ってみました。
今回の結果としては、特にRTX系のバランスの良さが目立つ形になりました。

GPU性能差と量子化の影響を見る目的で、主にGPUとモデルの組み合わせを変えて比較しています。
引数は「-ngl 99 -fa 1 -p 512 -n 128 -r 5」で固定です。

GPU	バックエンド	モデル
P106-100	CUDA12.2	gemma-4-E4B-it-Q5_K_M
RTX3060	CUDA13.0	gemma-4-E4B-it-Q5_K_M
RTX3060	CUDA13.0	gemma-4-26B-A4B-it-UD-IQ1_M
Jetson Xavier NX	CUDA 11.4	gemma-4-E4B-it-Q5_K_M
Jetson Xavier NX	CUDA 11.4	gemma-4-E2B-it-Q5_K_M
2400G	Vulkan	gemma-4-E4B-it-Q5_K_M
2400G	Vulkan	gemma-4-E2B-it-Q5_K_M
2400G	Vulkan	gemma-4-26B-A4B-it-UD-IQ1_M
MI25	Vulkan	gemma-4-E4B-it-Q5_K_M
MI25	Vulkan	gemma-4-26B-A4B-it-UD-IQ1_M
MI25	Vulkan	gemma-4-26B-A4B-it-UD-IQ4_NL

続きを読む →

MicroServer N54LでProxmox Backup Serverを構築する

コメントを残す

LSI MegaRAID 9261-8iを使ってHDD*4、SSD*1、LTOドライブをつないでMicroServer N54Lに組み込んでProxmox Backup Serverを構築します。

続きを読む →

P440でHUS726060AL4210を使いたい

コメントを残す

3.5インチSAS 6TBのHUS726060AL4210を買ってML30 Gen9のP440につないで、ssacliで見るとUnsupported Drivesと表示されてRAIDが構成できませんでした。

どうやら4kのセクタサイズはサポートしていないようなので、対応していきます。

続きを読む →

Rocky Linux9でmaincraftサーバを動かす

コメントを残す

久しぶりに遊びたくなったので、RockyLinuxでマイクラサーバを動かそうと思います。

minecraftのバージョンは1.21をセットアップします。

続きを読む →

VXLAN on Oracle Linux8

コメントを残す

遠隔地でL2でほしいケースに対する選択肢としてL2TPやVPNを試してきましたが、VXLANがLinuxはカーネルレベルサポートらしいことを知ったので試してみます。

続きを読む →

Rocky LinuxとRadeon Instinct MI25でROCmを使う②冷却編

コメントを残す

Radeon Instinct MI25ですが、GPUはパッシブクーラーがついています。
そのため、FANはついておらずケース内のエアフローで何とかする必要があります。

自作PCで300WのGPUを冷やしきるほどのエアフローは確保できないので、FANをつけて冷やします。

続きを読む →

Rocky LinuxとRadeon Instinct MI25でROCmを使う①環境準備編

コメントを残す

RX480でのROCmが面白かったので、Radeon Instinct MI25入手してみたので、環境準備を行います。

環境は以下の自作PCにRocky Linux9.4をMinimumインストールしました。
CPU：Ryzen 7 2700X
MB：X470 GAMING PLUS
RAM：16GB×2枚 2400 MHz
SSD：BIOSTAR S120-256
GPU#1:MI25
GPU#2:MI25
GPU#3:V3900

続きを読む →