ComfyUIとは何か — 画像生成を「配線図」で組み立てる

ComfyUIをClaude Codeから操れるComfy MCP徹底解説 - ComfyUIとは何か — 画像生成を「配線図」で組み立てる - 章扉

Comfy MCPを理解するには、まず土台であるComfyUIが何をする道具なのかを押さえる必要がある。ComfyUIは、Stable DiffusionやFLUX、各種動画モデルといった拡散モデル(ディフュージョンモデル)を動かすためのノードベースのGUIである。カナダ・ケベックシティの開発者comfyanonymous(本名Yanick)が2022年末にStable Diffusionに触れたのをきっかけに、2023年1月に個人プロジェクトとして公開したのが始まりだ。以来ComfyUIは、AUTOMATIC1111やForgeといったスライダー式のUIから乗り換えるパワーユーザーの受け皿となり、2026年時点では本格的な画像・動画制作の「デファクトスタンダード」と呼ばれる位置を占めている。運営会社Comfy Orgによれば利用者は400万人を超え、1日あたりのダウンロードは15万件、NetflixやApple、Ubisoftといった企業が有料顧客に名を連ねる。

ComfyUIの最大の特徴は、生成処理の一つひとつの工程を「ノード」という箱として画面上に並べ、それらを線でつないで一本の生成パイプラインを作り上げる点にある。ボタンやスライダーの裏で何が起きているかが隠されている他のツールと違い、拡散モデルが画像を生み出すまでの全段階が可視化され、分岐させたり差し替えたり再利用したりできる。

具体的に、もっとも基本的な「文字から画像を作る(text-to-image)」ワークフローは次のようなノードの連なりで構成される。まずLoad Checkpoint(チェックポイント読み込み)ノードが、SDXLやFLUXといった学習済みモデルの.safetensorsファイルを読み込む。次にCLIP Text Encodeノードが、「猫が窓辺で眠っている、映画的なライティング」といったプロンプト(および除外したい要素を書くネガティブプロンプト)をCLIPモデルで数値ベクトル(埋め込み)に変換する。その埋め込みを受け取ったKSamplerノードが、ノイズだらけの潜在空間から少しずつノイズを取り除く「デノイジング」を、指定したステップ数・サンプラー(例:DPM++ 2M Karras)・シード値に従って実行する。最後にVAE Decodeノードが、KSamplerが出力した潜在表現を実際のピクセル画像へ復元し、Save Imageノードが保存する。ここにControlNetノードで構図を制御したり、LoraLoaderノードで作風を追加したり、Upscaleノードで高解像度化したりと、目的に応じてノードを足していくのがComfyUIの流儀である。

このノード構成にはもう一つ重要な性質がある。再現性だ。ComfyUIが書き出したPNG画像には、その画像を生んだワークフロー全体がメタデータとして埋め込まれている。そのPNGをキャンバスにドラッグするだけで、配線・モデル・シードを含む生成条件が丸ごと復元され、まったく同じ結果が得られる。この「ワークフロー=共有可能な設計図」という発想こそ、後述するComfy MCPがエージェントに渡す道具立ての中核になっている。

ComfyUIをClaude Codeから操れるComfy MCP徹底解説 - ComfyUIとは何か — 画像生成を「配線図」で組み立てる - 図表1

MCPとComfy MCP — なぜ「エージェントが操る」のか

ComfyUIをClaude Codeから操れるComfy MCP徹底解説 - MCPとComfy MCP — なぜ「エージェントが操る」のか - 章扉

もう一つの土台がMCP(Model Context Protocol)である。MCPはAnthropicが提唱した、AIエージェントと外部のツールやデータを結ぶ標準規格だ。いわば、さまざまな機器を同じ差込口でつなぐ「共通コンセント」のようなもので、この規格に対応したサーバーを一つ立てておけば、Claude Code・Claude Desktop・Cursor・Codexといった対応クライアントのどれからでも同じツール群を呼び出せる。MCP自体は仕様策定が進む標準規格で、次期仕様のリリース候補(Release Candidate)も2026年7月28日付で公開が予定されており、エコシステムとして成熟段階に入りつつある。

Comfy Orgはこのコンセントの先に、ComfyUIエンジンまるごとを差し込んだ。2026年6月29日、同社は創業メンバーでコミュニティ・パートナーシップを担うJo Zhang氏とMatt Miller氏の連名による告知で、Comfy MCPを公開ベータとして発表する(GIGAZINEやComfyUI Wikiなど各メディアは6月30日付で報道した)。公式ブログはこれを「本番パイプラインのために作られた初のMCP」と位置づけ、「今日から、誰もが自分専用のComfyUIエキスパートを手にする」「あなたのエージェントをクリエイティブ・テクノロジストに変える」と表現している。従来はノードの知識がなければ扱えなかったComfyUIの全機能が、自然言語の指示だけで動くようになる、というのがその主張の核心だ。

これは単なる思いつきの機能追加ではない。ComfyUIを開発するComfy Orgは、2024年6月3日に法人化され、GoogleのApp Search機械学習チーム出身のYoland Yan氏が共同創業者兼CEOを務め、社員数は約70名の体制へと成長している。資金調達も進み、2025年に1,700万ドル(約27億円)を調達したのち、2026年4月24日にはCraft Ventures(David Sacks氏が創業したVC)が主導し、Pace Capital、Chemistry、TruArrowが参加するラウンドで3,000万ドル(約48億円)を、評価額5億ドル(約805億円)で調達したことをTechCrunchなどが報じた。VercelのGuillermo Rauch氏ら既存投資家も持分を継続した。累計調達額はおよそ4,800万ドル(約77億円)に達する。個人が2週間のコーディングで生んだツールが、わずか3年で企業インフラを支える基盤へと化けた——その延長線上に、エージェント時代への布石としてComfy MCPが置かれている。

Comfy MCPは単一の製品ではなく、四つの構成要素からなるスイートである。クラウド上でワークフローを実行するComfy Cloud MCP(公開ベータ)、30以上の外部AI生成APIを束ねるComfy Partner MCP(プライベートプレビュー)、ターミナルから自動化するComfy CLI(ベータ)、そしてコミュニティのノウハウを配布するComfy Skillsである。以下、それぞれを具体的に見ていく。

ComfyUIをClaude Codeから操れるComfy MCP徹底解説 - MCPとComfy MCP — なぜ「エージェントが操る」のか - 図表1ComfyUIをClaude Codeから操れるComfy MCP徹底解説 - MCPとComfy MCP — なぜ「エージェントが操る」のか - 図表2

Comfy Cloud MCP — チャットだけでクラウドGPUを操る本丸

ComfyUIをClaude Codeから操れるComfy MCP徹底解説 - Comfy Cloud MCP — チャットだけでクラウドGPUを操る本丸 - 章扉

四つの中で今回の主役が、公式のホスト型サーバーであるComfy Cloud MCPだ。実体はhttps://cloud.comfy.org/mcpで稼働するリモートMCPサーバーで、エージェントからのツール呼び出しをComfy Cloudへの認証済みリクエストに変換し、実際の生成処理をクラウドのGPU上で走らせる。手元にグラフィックボードがなくても、Comfyアカウントさえあれば動く。GIGAZINEが「低スペックPCでも動く」と見出しに掲げたのはこの仕組みゆえだ。稼働基盤にはBlackwell世代のRTX 6000 Pro(VRAM 96GB)が使われる。

接続はクライアントごとに用意されている。Claude Code・Claude Desktop・CodexはOAuthによるブラウザ認証、CursorやCI環境などヘッドレス用途ではX-API-KeyヘッダーにAPIキーを載せる方式だ。Claude Codeの場合、/plugin marketplace add Comfy-Org/comfy-skillsでマーケットプレイスを登録し、/plugin install comfy-cloud@comfy-skillsを実行、続いて/mcpからOAuth認証を通せば準備が整う。Claude Desktopなら設定のコネクター追加で同じURLを登録するだけでよい。

このサーバーがエージェントに与える「道具」は、いくつかの機能グループに整理されている。まず対象を探すための探索系として、テンプレートを探すsearch_templates、その中身のJSONを取り出すget_template、上書き可能なパラメータを見るget_template_schema、モデルを検索するsearch_models、ノードやサブグラフを探すsearch_nodes、ノードの入力仕様を取得するget_node、グラフの構造を問い合わせるcql、作風設定の助言を得るget_prompting_guideが揃う。生成系ではテンプレートを実行するrun_template、API形式のワークフローを投入するsubmit_workflow、パートナーAPIモデルを呼ぶpartner_generate、入力画像をアップロードするupload_fileなどがある。加えて、ジョブの状態を追うget_job_statuswait_for_jobget_output、複数まとめて処理するsubmit_batchなどのバッチ系、保存済みワークフローを扱うsave_workflowrun_saved_workflow、共有用のshare_workflowimport_shared_workflow、課金状況を見るget_billing_statusまで、数十のツールが公式ドキュメントに列挙されている。初期にレビューしたMCP.Directoryは「16のツール」と要約したが、ベータ期間中に道具立ては拡張され続けている。

Comfy Cloud MCPの思想を象徴するのが、この共有系のツールだ。生成したワークフローは保存して共有URLに変換でき、そのURLを渡された相手のエージェントがインポートして、同じパイプラインを新しい入力に対して再実行できる。「100%再現可能」を掲げるこの仕組みは、個人の遊びではなくチームの本番パイプラインを想定したものだといえる。もう一つ重要なのが支出ゲートの設計で、パートナーモデルや有料APIノードを含む実行のようにComfy Cloudのクレジットを消費する処理に入る際は、サーバーがユーザーの明示的な同意を求める。エージェントが勝手に課金を積み上げないための歯止めである。

料金は使った分だけ課金される従量制で、各プランに毎月のクレジットが付く。公式の価格ページによれば、Standardが月20ドル(約3,200円)で4,200クレジット・1ワークフロー同時実行、「最も人気」とされるCreatorが月35ドル(約5,600円)で7,400クレジット・LoRA持ち込み・3並列、Proが月100ドル(約1万6,100円)で21,100クレジット・最長1時間の実行・5並列、その上にカスタム価格のEnterpriseが用意される。GPU課金レートは2026年1月に1秒あたり0.39クレジットから0.266クレジットへ引き下げられており、Standardの4,200クレジットは実稼働でおよそ4時間強のGPU時間に相当する。新規登録者向けに少量の無料クレジット枠が提供されているとの報道もあるが、公式価格ページに掲載される正規プランは月20ドルのStandardからとなっている。

ComfyUIをClaude Codeから操れるComfy MCP徹底解説 - Comfy Cloud MCP — チャットだけでクラウドGPUを操る本丸 - 図表1

マルチモーダル生成の実際 — 画像・動画・3D・オーディオ

ComfyUIをClaude Codeから操れるComfy MCP徹底解説 - マルチモーダル生成の実際 — 画像・動画・3D・オーディオ - 章扉

Comfy MCPの訴求点は、単なる画像生成の自動化にとどまらない。画像・動画・3D・オーディオという主要モダリティをすべて、同じチャットの流れの中で扱える点にある。

画像生成ではFLUX、Ideogram、Recraft、Stability、OpenAIのGPT画像、xAIのGrok、GoogleのGemini(通称nano-banana)といったモデル群が使え、背景除去やアップスケール、要素の追加・削除といった編集も自然言語で頼める。動画ではKling、Luma(Ray/Photon)、RunwayのGen-3、Pika、Vidu、Moonvalley、MiniMax(Hailuo)、GoogleのVeo、ByteDanceのSeedanceなどが並ぶ。3Dはテキストや参照画像からGLB/FBX/OBJのメッシュを起こすMeshyやHunyuan3D、Tripoが、オーディオはElevenLabsによる音声合成・ボイスクローン・効果音やStability Audio、さらに楽曲生成までがカバーされる。

真価が出るのは、これらを一続きの会話でつなぐときだ。公式が例に挙げるのは、「一枚のスニーカーの主役カットから、4つのアスペクト比で20種類の広告バリエーションを作って」「保存してある商品撮影ワークフローを、この5枚の新しい画像に対して回し直して」「3枚の絵コンテを映画的なクリップにして、そのうえで使ったワークフローを説明して」「12枚のカードアート用ポーズで同じキャラクターを一貫して生成して」といった指示である。生成した画像をいったんダウンロードして再アップロードすることなく、ある工程の出力を次の工程の入力へ直接引き渡せるため、「生成→アップスケール→背景除去」といった多段パイプラインが、一つの対話として自然に流れる。人間はノードエディタを開くことなく、意図とプロンプトの精度、そして「これは本当に良いか」という審美眼に集中できる——これがComfy MCPの描くワークフロー像だ。

ComfyUIをClaude Codeから操れるComfy MCP徹底解説 - マルチモーダル生成の実際 — 画像・動画・3D・オーディオ - 図表1

Comfy Partner MCP — Runway・ElevenLabsなど30超のAPIを一つの窓口に

ComfyUIをClaude Codeから操れるComfy MCP徹底解説 - Comfy Partner MCP — Runway・ElevenLabsなど30超のAPIを一つの窓口に - 章扉

四つの構成要素のうち、外部サービス統合を担うのがComfy Partner MCPである。これはクラウド上のホスト型ではなく、ユーザーの手元で動くローカルのMCPサーバーという点が特徴だ。その役割は、BFL(Black Forest Labs、FLUX提供元)、Ideogram、Kling、Runway、Veo、Meshy、ElevenLabsをはじめとする30以上のパートナーAPIプロバイダーを、単一の統一されたリクエスト形式の下に束ね、一つの窓口から呼び出せるようにすることにある。プロバイダーごとに異なるAPIの作法を覚える必要はなく、エージェントは共通の語彙で「画像を作れ」「動画にしろ」と頼めばよい。

提供される道具は10種類にまとめられている。静止画の生成・編集・アップスケールを行うgenerate_image、テキストや画像からの動画生成・リップシンクを担うgenerate_video、メッシュを起こすgenerate_3d、ベクター図を作るgenerate_svg、音声・ボイスクローン・効果音のgenerate_audio、楽曲のgenerate_music、ファイルを上げてmedia:参照を得るmedia_upload、成果物を取得して表示するread_media、モデルを検索し呼び出し仕様を読むmodels_explore、そして残高をドル建てで確認するbalanceである。これらで画像・動画・3D・SVG・オーディオ・音楽という6つのモダリティを覆う。動作にはNode.js 20以上とpnpm 10、comfyui-で始まるComfy APIキーが要る。

Comfy Cloud MCPが自前のクラウドGPUで拡散モデルを回すのに対し、Partner MCPは各社のAPIを叩くだけなのでローカルGPUを必要としない。手元のマシンで動きつつ、生成の実体は外部サービスにある、という構図だ。ただし現時点ではプライベートプレビューの段階にあり、招待されたパートナーのみがアクセスできる。機能やAPIは変更され得ると公式ドキュメントは明記している。RunwayやElevenLabsといった一線級の商用モデルを、ComfyUIのエコシステムの作法のまま横断的に扱えるようになる意味は大きく、正式公開が待たれる部分である。

Comfy CLIとComfy Skills — ターミナル自動化とコミュニティ資産

ComfyUIをClaude Codeから操れるComfy MCP徹底解説 - Comfy CLIとComfy Skills — ターミナル自動化とコミュニティ資産 - 章扉

GUIやチャットの外側で自動化を担うのがComfy CLI(comfy-cli)だ。もともとはComfyUI本体のインストールや管理を担うPython製のコマンドラインツールだが、今回のアップデートでエージェント時代に向けた二つの主力コマンドが加わった(ベータ提供)。

一つはcomfy generateで、ローカルのComfyUIもワークフローJSONも用意せずに、パートナーノードをターミナルから直接叩く。画像モデル(FLUX、Ideogram、DALL·E、Recraft、Stability、Runway、Reve、Grok、Geminiのnano-bananaなど)と動画モデル(Kling、Luma、Runway Gen-3、Pika、Vidu、Moonvalley、Hailuo、Grok動画、Seedanceなど)を単発のCLI呼び出しで実行でき、動画のように時間のかかるジョブは非同期で走り、CLIが完了までポーリングする。バッチ処理やちょっとした実験、フルのグラフが不要な自動化に向く。もう一つのcomfy runは、完全なComfyUIワークフローグラフを投入するコマンドで、API形式でも書き出したUI形式のJSONでも受け付け(UI形式はクライアント側でAPI形式へ変換される)、ローカルにもクラウドにもルーティングできる。既定で非同期に動き、ミリ秒単位でprompt_idを返してバックグラウンドで進捗を追う。CI/CDパイプラインに生成処理を組み込むような使い方はここが担当する。認証はOAuthかAPIキーで行う。

そしてComfy Skillsは、こうした能力をエージェントに授けるコミュニティのスキルライブラリだ。GitHubのComfy-Org/comfy-skillsリポジトリで管理され、Claude Code向けにはマーケットプレイス経由で導入する。/plugin marketplace add Comfy-Org/comfy-skillsでリポジトリを登録し、/plugin install comfy-cloud@comfy-skillsを実行すると、Comfy Cloud MCPへの接続と/comfy-cloud:*という名前空間のスラッシュコマンド群が一括で入る。用意されるコマンドは画像を生成・編集する/comfy-cloud:generate-image、動画のgenerate-video、音声のgenerate-audio、3Dのgenerate-3d、モデル・ノード・テンプレートの検索、背景除去やアップスケールなど12種類に及ぶ。設計上は「時とともに変わるモデル名のような事実をハードコードせず、エージェントに動的に選択肢を発見させる」方針が採られており、モデルの世代交代に強い作りになっている。

ローカル派の選択肢 — ComfyUI Desktopとartokun/comfyui-mcp

ComfyUIをClaude Codeから操れるComfy MCP徹底解説 - ローカル派の選択肢 — ComfyUI Desktopとartokun/comfyui-mcp - 章扉

公式Comfy MCPの最大の割り切りは、実行がComfy Cloud限定である点だ。手元のComfyUI Desktop(公式のワンクリック型デスクトップアプリ)や自前サーバーのGPUで回したいユーザーにとって、この「クラウド専用」は物足りない。Comfy Org自身もこの点は認識しており、公式ドキュメントは「cloud.comfy.orgのホストサーバーはComfyチームにしか作れず運用できないものであり、まずそこから出した」「ローカルのエージェント連携は目新しいものではなく、ComfyUIがオープンソース化された時から存在してきた」と説明する。そのうえで「ファーストパーティのローカル・エージェント体験を改善することは我々のビジョンの一部だ。クラウドMCPは最初に出せた部分にすぎず、ローカルの作り込みはこれから続く」と、ローカル対応が今後の課題であることを明言している。

そのローカル対応を、公式が追いつくより先にコミュニティが埋めてきた。公式ドキュメント自身が、ローカル用途の選択肢としてartokun/comfyui-mcpshawnrushefsky/comfyui-mcpjoenorton/comfyui-mcp-serverlalanikarim/comfy-mcp-serverという4つのコミュニティ製サーバーを挙げている。中でも最も活発に使われているのが、artokun氏(Comfy Orgのフロントエンドv2グラフレンダラーなどにPRを送る常連貢献者)によるartokun/comfyui-mcpだ。「ローカルファースト、エージェントネイティブなComfyUIの操縦席」を掲げるこのプロジェクトは、108のMCPツールと約30(ヘッドラインは29、詳細セクションは32と表記)のAIスキルを備え、FLUX、WAN、LTX 2.3、Qwen、Z-Image、Ideogram 4、ERNIE、ANIMAに加えSD1.5/SDXL系まで、モデルごとの勘所を作り込んでいる。MITライセンスで、GitHubのスター数は264を数える。

公式サーバーが「プロンプトを転送するだけの薄いコネクター」に近いのに対し、artokun版はグラフをノード単位で組み上げ、編集し、反復する完全な操縦席であると自らを位置づける。Claude Codeプラグインとしても振る舞い、/comfy:gen/comfy:viz/comfy:debugなど11のスラッシュコマンド、explorer・debugger・optimizerといった4つの自律エージェント、VRAM監視やジョブ完了通知など4つのフックを載せる。導入は~/.claude/settings.jsonnpx -y comfyui-mcpを登録するだけで、ローカルはもちろん、--comfyui-urlでLANやVPS、COMFYUI_API_KEYでComfy Cloud、--tunnelでCloudflare経由のリモート接続まで、一つの設定で三様のデプロイ先を狙える。「ローカルファーストであってローカル専用ではない」という設計思想がここに表れている。

同種のアプローチとして、ComfyUIのカスタムノードとしてMCPサーバーを立ち上げ、ブラウザのComfyUIタブ内にxterm.jsのターミナルまで埋め込むComfy Pilot(ConstantineB6/comfy-pilot)もある。Claudeが現在のグラフを見て、ノードを作って接続し、ワークフローを実行し、生成画像を確認し、Hugging FaceやCivitAIからモデルをダウンロードするところまでを担う。Claude DesktopやClaude Code、Cursor、VS Code(GitHub Copilot)、Windsurf、Clineといった主要MCPクライアントに対応する。

ComfyUIをClaude Codeから操れるComfy MCP徹底解説 - ローカル派の選択肢 — ComfyUI Desktopとartokun/comfyui-mcp - 図表1

Comfy MCPのベストプラクティス

ComfyUIをClaude Codeから操れるComfy MCP徹底解説 - Comfy MCPのベストプラクティス - 章扉

実際に使いこなすうえでの勘所は、公式ドキュメントや先行して触れたクリエイターの検証記事から浮かび上がってくる。

第一に、まずはClaude CodeかClaude Desktopから始めること。ローンチ時に4クライアント対応をうたうものの、現時点で一次サポートのOAuthが整うのはこの二つで、CursorやCodex、Hermes、Windsurfなどは順次対応の段階にある。第二に、実行の前に必ず探索ツールを使うsearch_modelssearch_nodessearch_templatesでエージェントに実在する機能を参照させておけば、存在しないノード名やモデルを幻覚(ハルシネーション)する事故を防げる。第三に、出力の引き渡し(チェイニング)を活用する。ある実行結果をダウンロード・再アップロードせずに次の工程へ渡せるため、「生成→アップスケール→背景除去」のような多段処理が一つの会話としてまとまる。

第四に、非同期であることを前提に振る舞うsubmit_workflowは画像そのものではなくジョブIDを返すので、get_job_statusで完了を確認してからget_outputを呼ぶ流れになる。動画や3Dは特に時間がかかるため、待ちを織り込んだ指示が要る。第五に、共有URLでチームの再現性を担保するsave_workflowで保存しshare_workflowでURL化して配れば、相手はノードエディタを一度も開かずに新しい入力で同じ処理を回せる。第六に、支出を意識する。実行はComfy Cloudのクレジットという有料資源を消費するため、支出ゲートの同意プロンプトを軽視しないこと。ローカルのComfy Pilotを検証したクリエイターは、複雑なワークフロー構築で1セッションに10〜20回のエージェント呼び出しを消費するとし、常用するならClaude Maxプラン(月100ドル=約1万6,100円)が実質的に前提になると述べている。

そして、ローカルのグラフをエージェントに触らせる場合の実務上の助言として、そのクリエイターは二点を強調する。変更前に必ずワークフローの要約をClaudeに述べさせること(古いグラフ状態のまま操作すると接続エラーの原因になる)、そしてCLAUDE.mdにガードレールを書いておくことだ。たとえば「私に確認せずモデルのダウンロードやノードのインストールをしないこと」と明記しておけば、エージェントの自動ダウンロードがもたらすセキュリティ露出を抑えられる。最終的な創作の方向づけ、プロンプトの練り込み、そして「これは本当に良いか」という判断は、依然として人間の側に残る——ここを外さないことが、Comfy MCPを使いこなす最大の勘所だといえる。

現場の受け止めと今後のロードマップ

ComfyUIをClaude Codeから操れるComfy MCP徹底解説 - 現場の受け止めと今後のロードマップ - 章扉

報道の温度感は媒体によってはっきり分かれた。ComfyUI WikiやGIGAZINE、日本のAICUといった媒体は「ノードに触れずに操れる」「低スペックPCでも動く」というアクセシビリティを前面に出した肯定的な紹介が中心で、AICUはキャラクター解説を交えて生成AIの民主化とチーム再現性を歓迎した。実務比較に踏み込んだPERSC Journalは、LLMノード・MCPサーバー・Claude Codeプラグインという三系統を用途別に整理してみせている。その一方で、批判的・分析的な視点を提示したのは実質的にMCP.Directoryほぼ一つで、同メディアは反応が薄いことを率直に認めつつ最も鋭い懐疑を拾い上げた。実際、RedditやHacker Newsに専用の大型スレッドは立たず、草の根の議論は公開から数日たっても静かなままだった。エージェントからComfyUIを操ること自体は目新しくなく、今回は「コミュニティがすでに作っていたパターンを公式が整えた」に近い、という玄人筋の冷めた受け止めがその背景にある。

MCP.Directoryが公開告知のコメント欄から拾った最も辛辣な声は「遅すぎる。3年前から自分はローカルのエンドポイントを叩いてフローを実行していた」というもので(発言者は記録されておらず、この一次証言はほぼ単一ソースにとどまる)、同メディアはこれを「ComfyUIのHTTP APIは何年も前からエージェントを動かしてきた。MCPは後発の任意のラッパーにすぎず、堀(moat)はプロトコルではなくワークフローの側にある」と一般化する。批判の芯にあるのはやはりクラウド専用・アカウント紐付けという構造で、ローカルGPU経路もオフライン動作もないことが、artokun版をはじめとするローカルファースト陣営の存在理由になっている。NDA下の案件をオフラインで完結させたい層にとって、この一点は譲れない。ローンチ時点でMCP世代の生成料金が未公表だった点も、正直な穴として指摘された。

ここに、この製品が抱える本質的な緊張がある。Comfyはもともと「人間を工程に組み込む(human-in-the-loop)」手動制御の細やかさをブランドの核にしてきた。共同創業者でCEOのYoland Yan氏は2026年4月、MidjourneyやChatGPTのようなプロンプト一発型ツールを「60〜80%までは行くが、残りの20%を変えようとするとスロットマシンを回すことになる」と評し、「AIスロップ(粗製濫造されたAI生成物)がそこら中にあふれる世界では、Comfy流のhuman-in-the-loopが最終的に最も多くの視線を勝ち取る」とTechCrunchに語っていた。にもかかわらずComfy MCPが売り込むのは「ノード不要、ダウンロード不要、GPU不要」という、まさにその手動制御を消していく方向の体験だ。自らが批判した「スロットマシン」へ一歩近づくのか、それともエージェントを熟練者の意図を増幅する新しい操縦桿として飼い慣らすのか——AIクリエイターにとっての本当の論点は、機能の多寡ではなくこの一点に集約される。ローカルのグラフをノード単位で編集し続けるartokun版が支持を集めるのは、その手触りを手放したくない層が確かに存在することの裏返しでもある。

今後の動きは、いくつかの方向がすでに示されている。対応クライアントはCodex・Cursor・Hermes・Windsurfへと順次広げられる見通しだが、公式は「さらなるクライアント対応は近日」とするのみで具体的な期日は示しておらず、ブラウザを開けない環境向けのデバイスコード方式のOAuthフローが計画段階にある、という程度の粒度だ。プライベートプレビュー段階のComfy Partner MCPが招待制から一般提供へ移行すれば、RunwayやElevenLabsなど商用APIの横断利用が誰にでも開かれる。そして最大の焦点は、公式が「これから続く」と明言したファーストパーティのローカル・エージェント対応である。クラウドで型を作り、そこで得た知見をローカルへ還流させる——その一手が出れば、いまはコミュニティ製サーバー(108ツールを擁するartokun版や、軽量なjoenorton版など)が担ってきた領域に公式が本格参入することになり、既存プロジェクトとの棲み分けや協調が次の論点になる。基盤となるMCP仕様自体も2026年7月末に次期リリース候補が控えており、規格の安定とともにComfy MCPの道具立ても洗練されていく。画像生成のUIから始まったComfyUIが、エージェントが創作の一端を担う時代の「実行基盤」へと役割を広げられるか——その試金石が、この夏に投じられたComfy MCPである。