livlea blog

Live as if you were to die tomorrow. Learn as if you were to live forever. (Mohandas Karamchand Gandhi)

ComfyUIをEVO-X2(Windows11)で試す [その②]

ComfyUIのWindowsのportal版がバージョンアップしており、ROCmのv7.1.1に対応したものがリリースされていたので、SD3.5シンプルを使って、画像生成時間がどれくらいになったか確認してみました。ComfyUIのv0.3.76からROCm v7.1.1対応されていたようですが、今回は現時点(2025年12月13日)で最新の v0.4.0を試しました。

Releases note

github.com

実行環境

PC:EVO-X2(AMD Ryzen AI Max+ 395、128GBモデル)
OS:Windows 11 Pro
ComfyUI:Experimental portable for AMD GPUs(v0.4.0)

ComfyUIは、公式のこちらからダウンロードしています。
run_amd_gpu.bat でComfyUIを起動します。Pythonは v3.12.10、PyTorchは2.9.0+rocmsdk20251116のようです。

batファイル実行後のPowerShell画面

画像生成速度の評価

今回もこちらのブログ記事(この時はComfyUI v0.3.66を利用)と同じように、SD3.5シンプルで速度評価しました。

blog.livlea.com

モデルはsd3.5_large_fp8_scaled.safetensorsを使っています。生成する画像の解像度は1024 x 1024と512 x 512で試しました。解像度以外は、SD3.5シンプルのテンプレートのデフォルトのままにしています。初回実行時はモデルのロードがあるので、表に記載している時間より少し長くなりますが、2回目以降は、表に記載の時間とほぼ同じでした。v0.3.66の結果も比較のために記載しています。今回試したv0.4.0では、1枚生成するのに解像度1024 x 1024の場合は約106s、解像度512 x 512の場合は約24sと、v0.3.66と比較して大幅に生成速度が速くなっていました。

解像度 画像生成時間 @ v0.4.0 画像生成時間 @ v0.3.66
1024 x 1024 約106s 約314s
512 x 512 約24s 約66s

SD3.5シンプルでの生成画像(解像度 1024 x 1024)

SD3.5シンプルでの生成画像(解像度 512 x 512)

まとめ

ComfyUI自体の高速化・最適化も進んでいるとは思いますが、ROCmがv7.1.1になって生成AI向けにAMDのGPUがより最適化されてきているため、ここまで高速化したのだと思います。今後もROCmの進化に期待したいです。