Stable Diffusionの情報をまとめました。

Stable Diffusionをローカルで動かしたい。でも、調べれば調べるほど用語が増えて、AUTOMATIC1111だのComfyUIだのForgeだの、どれを選べばいいのかわからなくなる。これ、ほぼ全員が通る道なんですよね。

この記事では2026年時点の主要UIの違いと、自分の環境に合った選び方を整理します。あと、正直に言うと環境構築はそこそこ面倒なので、そのへんも踏み込んで書きます。

※本記事にはアフィリエイトリンクが含まれます。

そもそもローカルで動かす意味あるの？
主要UIは4つ（2026年時点）
4つのUIをどう使い分けるか
結局、どれから始めればいい？
導入手順（AUTOMATIC1111 / Forge共通）
よくある質問
まとめ

そもそもローカルで動かす意味あるの？

Stable Diffusionはテキストから画像を生成できるオープンソースのAIモデル。クラウドサービスでも使えるんですが、自分のPC上で動かすと違うメリットが出てきます。

主にこの3つ。

生成回数の制限がない（月額課金からの解放）
生成した画像がクラウドに送信されない（プライバシー保護）
モデルやLoRAを自由に差し替えられる（カスタマイズ性が桁違い）

ただ、これを成立させるにはNVIDIA GPU（VRAM 6GB以上）が事実上の前提です。スペックが低いと生成が遅くなる、というレベルじゃなく、機能が動かない場合もあります。2026年時点だと、RTX 30/40シリーズを持ってる人が快適に動かしてる印象。

正直に言うと、ハード面のハードルがある時点で、Stable Diffusionは「誰にでもおすすめ」ではないツールです。GPUを持ってない人が今からRTX 40番台を買って始めるかというと、それはまた別の判断が必要になります。

で、肝心のUI選びの話に入ります。

主要UIは4つ（2026年時点）

Stable Diffusionをローカルで使うときは、モデル本体に加えて「UI（操作画面）」を別途用意します。2026年時点の主要UIはこの4つ。

AUTOMATIC1111（WebUI）　長年の定番。拡張機能が豊富で情報量も圧倒的に多い
ComfyUI　ノードベース。ワークフローを細かく組める上級者向け
Forge　AUTOMATIC1111のフォーク版。高速化・低VRAM最適化
Fooocus　シンプルUI。初心者向けの設計

モデルはStability AI公式（Hugging Face）に加えて、CivitAIなどで配布されてるコミュニティ製のファインチューニングモデルも多数あります。用途に合わせて差し替えるのが基本の使い方。

4つのUIをどう使い分けるか

ツール名	月額	主な機能	おすすめの人	学習難易度
AUTOMATIC1111	無料（OSS）	txt2img・img2img・拡張機能多数・LoRA対応	情報を調べながら使いたい人・拡張性重視	中
ComfyUI	無料（OSS）	ノードエディタ・ワークフロー構築・API連携	細かい制御・自動化したい上級者	高
Forge	無料（OSS）	AUTOMATIC1111互換・高速化・低VRAM最適化	VRAM少なめ・速度重視のユーザー	中
Fooocus	無料（OSS）	シンプルUI・プロンプト補助・Midjourney風	とにかく手軽に始めたい初心者	低

AUTOMATIC1111

「Stable Diffusionのローカル環境」で検索すると、まず出てくるのがこれ。事実上の業界標準と言っていい立ち位置です。

強みは拡張機能の充実度。ControlNetやADetailerといった人気の拡張を入れることで、機能をどこまでも広げられます。あと日本語の情報量がぶっちぎりで多いのも実用的。エラーで詰まったとき、日本語で解決策が見つかる確率が一番高いUIです。

気になるのは、機能が多すぎてUIがごちゃごちゃしてること。最初の数日は「あの設定どこ？」を繰り返します。それと、最近は更新ペースが落ち気味で、Forgeに乗り換える人が増えてる印象もあります。

ComfyUI

ノードをつないでワークフローを組む形式のUI。処理の流れが視覚的に見えるのが強みです。

「画像生成→アップスケール→インペイント→保存」みたいな複雑なパイプラインを自動化できて、APIとして外部から呼び出すこともできる。Make.comと組み合わせて画像生成を自動化する、みたいな使い方をしてる人もいます。

逆に、初心者にはおすすめしません、これは。ノード操作に慣れるまでが本当にしんどい。最初の1〜2週間は「何これ難しい」と感じる人がほとんどです。明確な目的（自動化したい、APIで呼びたい）がない人が選ぶと挫折しやすいUIだと思います。

Forge

AUTOMATIC1111をベースに、メモリ効率と速度を改善したフォーク版。これが今、地味に効いてるんですよね。

AUTOMATIC1111の拡張機能と互換性が高いので、乗り換えハードルが低い。特にVRAM 6〜8GBの環境で動かしてる人は、Forgeに変えるだけで生成速度が変わるケースが多いです。「AUTOMATIC1111で動いてはいたけど遅かった」人には試す価値があります。

注意点として、すべての拡張機能が完全互換というわけではないので、自分が使ってる拡張がForgeで動くかは事前にチェックしたほうが安全です。

Fooocus

「とにかく画像を出したい」だけの人向けのUI。プロンプトを入れてボタンを押すと、あとは勝手にいい感じに出してくれる、というMidjourneyに近い体験ができます。

細かい設定をいじりたい人には物足りないですが、「Stable Diffusionを試してみたい」段階の人にはこれがベスト。挫折しません。

欠点としては、慣れてくると「もっと細かく制御したい」となって、結局AUTOMATIC1111やComfyUIに移行することになります。「入門の踏み台」と割り切るのがちょうどいい使い方。

結局、どれから始めればいい？

「PC環境」と「やりたいこと」の2軸で見ると整理しやすいです。

VRAMが8GB未満→Forge一択。AUTOMATIC1111でもギリギリ動きますが、Forgeのほうがストレスが少ないです。

VRAMが12GB以上で拡張機能を試したい→AUTOMATIC1111が無難。情報量と拡張性のバランスが取れています。

とにかく絵を生成したいだけ→Fooocus。設定を考えなくていいぶん、つまずきが少ないです。

自動化したい・APIで連携したい→ComfyUI。明確な目的があるならこれ。

私の場合、最初はFooocusで触って雰囲気を掴んでから、AUTOMATIC1111に移りました。いきなりAUTOMATIC1111から始めると、設定項目の多さで「これ自分には早すぎるかも」と感じる瞬間があります。段階を踏むほうが結局早い、というのが実体験です。

あと、ComfyUIをMake.comと組み合わせて画像生成を自動化する流れは、2026年に入ってから明らかに増えてきています。ブログのアイキャッチを自動生成する、SNS用の素材を量産する、といった用途で実用段階に入ってる感じです。

導入手順（AUTOMATIC1111 / Forge共通）

OSや環境で細かい違いはありますが、基本の流れはほぼ共通です。

1. Python・Gitのインストール　AUTOMATIC1111・ForgeはPython 3.10〜3.11推奨（公式GitHubのREADMEで最新版を確認）
2. リポジトリのクローン　GitHubから対象UIのリポジトリをクローン
3. 起動スクリプトの実行　Windowsならwebui-user.batを実行。必要なライブラリが自動でインストールされます
4. モデルファイルの配置　Hugging FaceやCivitAIから.safetensors形式のモデルをダウンロードして所定のフォルダに置く
5. ブラウザでアクセス　起動後、http://127.0.0.1:7860 にアクセスすると操作画面が開きます

正直、最初の導入は時間が溶けます。Pythonのバージョン違いでエラーが出る、CUDAが認識されない、ライブラリの依存関係がぶつかる。週末の半日くらいは覚悟しておいたほうがいいです。

詰まったらGitHubのIssuesと日本語コミュニティ（Twitterや個人ブログ）を漁るのが結局一番速いです。同じエラーで詰まってる人が必ずいるので、解決策が見つかる確率が高い。

よくある質問

Q. MacやAMD GPUでも使えますか？

MacはApple Silicon（M1/M2/M3）で動作対応が進んでます。AMD GPUはROCm経由で動かす方法がありますが、NVIDIAに比べるとサポートが限定的で、エラー対処の情報量も少ない。基本はNVIDIA GPU推奨です。

Q. 生成した画像の著作権はどうなりますか？

使うモデルのライセンスと、各国の法律次第です。商用利用を考えるなら、モデルごとのライセンス条件を必ず確認してください。2026年時点でも法整備は進行中で、状況は変わり続けています。

Q. モデルはどこからダウンロードできますか？

Stability AI公式モデルはHugging Face（huggingface.co）、コミュニティ製のファインチューニングモデルはCivitAI（civitai.com）が定番です。ダウンロード前にそれぞれのライセンスを必ず確認してください。

まとめ

ローカル運用は生成無制限・プライバシー・カスタマイズ性が強み。代わりにGPUと環境構築の手間が必要
UIはFooocus（手軽）→Forge or AUTOMATIC1111（本格運用）→ComfyUI（自動化）という順で段階を踏むのが現実的
VRAMが少ない人はForge優先。AUTOMATIC1111ユーザーで動作が遅い人もForgeを試す価値あり

個人的には、Stable Diffusionは「環境構築の壁さえ越えれば、あとは沼」という温度感のツールだと思ってます。最初の数時間〜数日が一番つらくて、そこを越えると一気に楽しくなる。逆に言うと、その壁を越える覚悟がないなら、最初はクラウドサービスやMidjourneyから入るほうが合うかもしれません。

ちなみにこのブログはMake.comで記事生成を自動化しています。興味がある方はこちら→Make.com（※アフィリエイトリンクです）