ComfyUIのWindowsのportal版がバージョンアップしており、ROCmのv7.1.1に対応したものがリリースされていたので、SD3.5シンプルを使って、画像生成時間がどれくらいになったか確認してみました。ComfyUIのv0.3.76からROCm v7.1.1対応されていたようですが、今回は現時点(2025年12月13日)で最新の v0.4.0を試しました。

実行環境
PC:EVO-X2(AMD Ryzen AI Max+ 395、128GBモデル)
OS:Windows 11 Pro
ComfyUI:Experimental portable for AMD GPUs(v0.4.0)
ComfyUIは、公式のこちらからダウンロードしています。
run_amd_gpu.bat でComfyUIを起動します。Pythonは v3.12.10、PyTorchは2.9.0+rocmsdk20251116のようです。

画像生成速度の評価
今回もこちらのブログ記事(この時はComfyUI v0.3.66を利用)と同じように、SD3.5シンプルで速度評価しました。
モデルはsd3.5_large_fp8_scaled.safetensorsを使っています。生成する画像の解像度は1024 x 1024と512 x 512で試しました。解像度以外は、SD3.5シンプルのテンプレートのデフォルトのままにしています。初回実行時はモデルのロードがあるので、表に記載している時間より少し長くなりますが、2回目以降は、表に記載の時間とほぼ同じでした。v0.3.66の結果も比較のために記載しています。今回試したv0.4.0では、1枚生成するのに解像度1024 x 1024の場合は約106s、解像度512 x 512の場合は約24sと、v0.3.66と比較して大幅に生成速度が速くなっていました。
| 解像度 | 画像生成時間 @ v0.4.0 | 画像生成時間 @ v0.3.66 |
|---|---|---|
| 1024 x 1024 | 約106s | 約314s |
| 512 x 512 | 約24s | 約66s |


まとめ
ComfyUI自体の高速化・最適化も進んでいるとは思いますが、ROCmがv7.1.1になって生成AI向けにAMDのGPUがより最適化されてきているため、ここまで高速化したのだと思います。今後もROCmの進化に期待したいです。