業務システムにおけるヒューマン・イン・ザ・ループ（HITL）、ヒューマン・オン・ザ・ループ（HOTL）、ヒューマン・アウト・オブ・ザ・ループ（HOOTL）の効果的な設計

「ループ」という言葉が業務システムの中心概念になった2026年

2023年から2024年にかけてのAIは、人間が「問いかける」相手だった。要約させ、下書きさせ、コードの断片を提案させる──しかし最終的にボタンを押すのは常に人間で、AIはあくまで助言者の位置にとどまっていた。2026年に入って様相は一変している。Andreessen Horowitz（a16z）が年初の「Big Ideas 2026」で簡潔に言い切ったように、AIは「何かを尋ねる対象」から「何かを実行する主体」へと役割を変えた。インターフェースはチャットから「アクション」へ、設計思想は人間優先から「エージェントが読める（agent-readable）」形式へとシフトし、仕事そのものをエージェントが遂行するようになった、というのがa16zの整理である。

この変化は、業務システムの設計図に新しい中心概念を持ち込んだ。AIが請求書を承認し、在庫を発注し、顧客へ返金を実行し、本番インフラの設定を書き換えるようになると、問われるのは「AIの精度は何%か」ではなく「人間はこの一連の流れのどこに立ち、どこで止められるのか」になる。Gartnerは2026年末までにエンタープライズ向けアプリケーションの40%がAIエージェントを内蔵すると予測し、Deloitteの「State of AI in the Enterprise」2026年版（経営層3,235人を対象に2025年8〜9月に実施）は、今は中程度以上にエージェンティックAIを使う企業が23%にとどまる一方、2年以内には74%へ跳ね上がると見込む。AIが「行動」を引き受ける比率が急上昇するからこそ、人間をどの位置に置くかという「ループ設計」が、セキュリティやUI以上に重い設計判断になっている。

その配置を表す語彙が、ヒューマン・イン・ザ・ループ（HITL）、ヒューマン・オン・ザ・ループ（HOTL）、ヒューマン・アウト・オブ・ザ・ループ（HOOTL）の三つである。これらは単なるバズワードではなく、もともとは人命に関わる領域で鍛えられた、責任の所在を定義するための厳密な分類だった。まずはその出自から押さえたい。

業務システムにおけるヒューマン・イン・ザ・ループ（HITL）、ヒューマン・オン・ザ・ループ（HOTL）、ヒューマン・アウト・オブ・ザ・ループ（HOOTL）の効果的な設計 - 「ループ」という言葉が業務システムの中心概念になった2026年 - 図表1

三つのループ ── HITL・HOTL・HOOTL とは何か

三つのループという考え方が最も精密に定義されてきたのは、意外にも軍事の文脈である。米国防総省の指令「DoD Directive 3000.09（兵器システムにおける自律性）」は、人間と自律システムの関係を三段階で区別する。第一が「ヒューマン・イン・ザ・ループ」、すなわち半自律型で、システムは人間のオペレーターが選択した個別の標的、あるいは特定の標的群に対してのみ作動する。第二が「ヒューマン・オン・ザ・ループ」、すなわち人間監督下の自律型で、システムは自ら作動するが、人間がその挙動を監視し、必要があれば交戦を停止できる。第三が「ヒューマン・アウト・オブ・ザ・ループ」、いわゆる完全自律で、いったん起動すれば人間のさらなる介入なしに標的を選択し交戦する。同指令はすべてのシステムについて「指揮官とオペレーターが武力行使に対して適切なレベルの人間の判断を行使できる」設計を求めているが、米政府と国防総省は「意味のある人間の制御（meaningful human control）」という表現を一貫して避けてきた。非現実的な水準の人間関与を含意するというのがその理由で、赤十字国際委員会（ICRC）やHuman Rights Watch、Stop Killer Robotsといった人道法・人権団体、フランスなど一部の国家はこれに反発し「意味のある人間の制御」を求める、という論争構図が今も続いている。

この「適切なレベルの人間関与とは何か」という問いは、そのまま業務システムへ移植できる。語彙を企業の現場に置き換えると、三つのモードはこう整理できる。

ヒューマン・イン・ザ・ループ（HITL） は、AIが提案や下書きを生成し、人間が一件ごとに承認・修正・却下してから初めて実行される方式である。AIは「ループの内側」に組み込まれ、人間がチェックポイントとして各ステップに座る。例えば、生成AIが起案した与信稟議をクレジットアナリストが一件ずつ承認する、コーディングエージェントが書いたコードを開発者がプルリクエストとしてレビューしてからマージする、コンタクトセンターのAIが下書きした返信をオペレーターが送信前に確認する、といった運用がこれにあたる。実行の手綱は常に人間が握っており、AIが単独で外界に影響を及ぼすことはない。

ヒューマン・オン・ザ・ループ（HOTL） は、AIが実行まで自走し、人間はその流れを監督して、異常時や例外時にのみ割り込む方式である。人間は「ループの上」に立ち、ダッシュボードやアラートを通じて全体を見渡し、必要なときに一時停止・差し戻し・停止のスイッチを引く。サプライチェーンの需給計画エージェントが発注を自動で起こし、プランナーは閾値を超えた異常だけを確認する、不正検知システムが大量のトランザクションを自動処理し、アナリストはフラグの立ったケースだけを精査する、といった運用が典型だ。AIは大量の実行を引き受け、人間は判断と監督に専念する。

ヒューマン・アウト・オブ・ザ・ループ（HOOTL） は、いったん設計・承認された範囲内では人間が一切介在せず、AIが検知から実行までを完結させる方式である。人間は事前のルール設計と事後の監査には関与するが、個々の実行の瞬間には立ち会わない。ミリ秒単位で判断が必要なため人間が物理的に間に合わない領域──ネットワーク機器のDDoS自動緩和、広告入札のリアルタイム最適化、与信枠内のカード決済の自動承認、ECサイトの動的価格設定など──が代表例である。これらは長年、明示的な「AIエージェント」と呼ばれずとも、実質的にHOOTLとして稼働してきた。

重要なのは、この三つが「優劣」ではなく「連続したスペクトラム」だという点だ。同じ業務でも、金額や影響度に応じてモードを切り替えるのが現代的な設計である。少額の返金はHOOTLで自動実行し、中額はHOTLで監督下に置き、高額や係争含みのケースはHITLで人間承認に回す──という具合に、一つのワークフローの中で三つのモードが共存する。2026年の業務システム設計とは、突き詰めればこの「どの判断を、どのループに割り当てるか」を決める作業に他ならない。

業務システムにおけるヒューマン・イン・ザ・ループ（HITL）、ヒューマン・オン・ザ・ループ（HOTL）、ヒューマン・アウト・オブ・ザ・ループ（HOOTL）の効果的な設計 - 三つのループ ── HITL・HOTL・HOOTL とは何か - 図表1

ヒューマン・イン・ザ・ループ（HITL）のベストプラクティス

HITLの要諦は、「人間が承認している」という形式を満たすことではなく、「人間が実質的に判断できる」状態を作ることにある。形だけのHITLは後述する「ラバースタンプ（追認印）」問題に直結するため、設計の良し悪しが効果を大きく左右する。

第一の原則は、承認ポイントを「不可逆な行動の直前」に絞ることだ。Anthropicが公開する効果的なエージェント設計の指針は、金銭の移動やデータ削除のような取り返しのつかない行動の前に、エージェントが一時停止して人間のレビューを挟むチェックポイントを置くことを推奨している。すべてのステップに承認を挟めば人間は疲弊し、かえって注意力が落ちる。可逆な行動は自動で流し、不可逆で高影響な行動だけを人間に上げる──この選別がHITL設計の出発点になる。

第二は、判断に必要な文脈を、人間が即座に理解できる形で提示することである。EU AI法の第14条（人間による監視）は、高リスクAIシステムについて、監視を担う自然人がシステムの能力と限界を正しく理解し、出力を正しく解釈し、そして「自動化バイアス（automation bias）」──AIの出力を自動的に、あるいは過度に信頼してしまう傾向──に常に注意を払えるよう設計することを義務づけている。実装上は、AIが下した判断の根拠、参照したデータ、確信度（コンフィデンス・スコア）を承認画面に併記し、人間が「なぜこの結論なのか」を数秒で追えるようにすることがこれに当たる。

第三は、意図的に「摩擦」を設計することだ。オーバーサイト研究が繰り返し指摘するのは、承認が速く滑らかであるほど、人間は中身を見ずに通してしまうという逆説である。確信度が低いケースでは二重チェックを要求する、人間に承認理由を一言書かせる、AIの推奨を即座に確定できないよう数秒の保留を挟む、といった「効きどころへの摩擦」が、追認を実質的なレビューへと引き戻す。

第四に、承認の結果を学習データとして回収する仕組みを組み込む。人間がどこを修正し、何を却下したかは、エージェントの品質改善に直結する一次データである。LangSmithのようなプラットフォームが「アノテーション・キュー（annotation queue）」と呼ぶ、人間のレビュー結果を構造化して蓄積する機能を備えているのはこのためだ。HITLは単なる安全弁ではなく、AIを鍛える教師信号の供給路でもある。

McKinseyが2025年12月〜2026年1月に約500組織を対象に実施した「2026 AI Trust Maturity Survey」は、この設計力の差を数字で示している。AI活用で高い成果を上げる企業（ハイパフォーマー）の65%が「定義されたHITLの検証プロセス」を備えていたのに対し、そうでない企業では23%にとどまった。HITLを「とりあえず人間を挟む」運用で済ませるか、検証プロセスとして設計し切るかが、成果の分水嶺になっている。

業務システムにおけるヒューマン・イン・ザ・ループ（HITL）、ヒューマン・オン・ザ・ループ（HOTL）、ヒューマン・アウト・オブ・ザ・ループ（HOOTL）の効果的な設計 - ヒューマン・イン・ザ・ループ（HITL）のベストプラクティス - 図表1

ヒューマン・オン・ザ・ループ（HOTL）のベストプラクティス

HOTLは、AIに実行を任せつつ人間が監督に回るモードであり、2026年のエンタープライズが最も向かおうとしている領域である。a16zが「我々が戦略を統治し、AIエージェントが実行を担う、HITLからHOTLへの移行」と表現したのも、BCGが成功には「明示的なHITLおよびHOTLのプロトコル」が必要だと説くのも、この層に企業価値の重心が移ると見ているからだ。

HOTLで決定的に重要なのは、監視を可能にする可観測性（オブザーバビリティ）の確保である。エージェントの失敗は、個々のAPI呼び出し単位ではなく、複数ステップにまたがる因果の連鎖として現れる。したがって、セッション全体のトレースを丸ごと捕捉できなければ、人間は「上から」監督しているつもりで実は何も見えていない、という事態に陥る。この層を支えるのが後述するエージェント・オブザーバビリティのツール群であり、全トラフィックに対してリアルタイムで品質メトリクスを走らせ、逸脱を検知する仕組みが前提になる。

第二に、「キル・スイッチ」と段階的エスカレーションの設計が欠かせない。Gartnerをはじめとする2026年の議論が口を揃えるのは、リアルタイム監視、エージェントの行動を即座に停止できるキル・スイッチ、そして包括的な監査証跡という三点が最低限の基礎装備だという点である。さらに、すべての認証イベント、ツール呼び出し、エージェント間の権限委譲、ポリシー判断を「何が・誰の代理として・どのポリシー条件下で起きたか」まで記録することが、コンプライアンス監査とリアルタイム監視の両方を成立させる。人間が監督から介入へ切り替える瞬間に、文脈が途切れず引き継がれることが、HOTLの生命線である。

第三に、人間とエージェントの比率を現実的に設計すること。VCのInsight PartnersのGeorge Mathew氏は、今後12〜18カ月のうちに、企業が大規模なデジタル労働者を管理する「ミリオン・エージェント問題（million-agent problem）」に直面すると警告している。一人の担当者が日々50体規模のエージェントを差配するような世界では、監督そのものが新しい専門職──「エージェント・オペレーション（agent operations）」──になる。HOTLは「人間が暇になる」モードではなく、「人間の仕事が実行から統治へ移る」モードだと捉える必要がある。

サプライチェーン領域は、この移行を最も具体的に進めている分野の一つだ。需給計画のエージェントが在庫データを自動で照合し、欠品リスクを予測して発注案を起こし、プランナーは閾値を超えた例外だけを承認する──という「HITLからHOTLへ」のアーキテクチャが、プロアクティブな計画立案の標準形として論じられている。ポイントは、エージェントが「反応する」だけでなく「先回りして」動くため、人間の監督が事後確認から事前の方針設定へと前倒しされることである。

ヒューマン・アウト・オブ・ザ・ループ（HOOTL）のベストプラクティス

HOOTLは最も誤解されやすいモードである。「人間がいない＝無責任」ではない。むしろ、人間の判断を個々の実行から外せるだけの設計・検証・統制を、事前に作り込んだ状態を指す。責任は消えるのではなく、実行時から設計時・監査時へと移動する。

HOOTLが正当化される条件は明確だ。第一に、人間が物理的に間に合わない速度が要求される領域であること。ミリ秒単位で応答するDDoS緩和や広告入札、高頻度の決済承認は、人間の介在自体が不可能だからこそ自動化されている。第二に、行動が十分に可逆か、損害が小さく限定的であること。少額返金やレコメンドの出し分けのように、誤っても容易にロールバックでき、被害が限定される行動はHOOTLに向く。第三に、入力と出力の分布が安定しており、想定外が起きにくいこと。逆に言えば、これらの条件が崩れる領域──高額・不可逆・倫理的に重い判断──をHOOTLに置くことは、設計上の重大な誤りになる。

ベストプラクティスの核心は、「自律の範囲」を狭く明示的に囲い込み、その外縁で必ず人間に戻すことである。AnthropicがマルチエージェントシステムでEUの推奨に従い「エージェントが暴走しないよう明示的なガードレールを設定した」と述べているのは、HOOTLであっても無制限の自律はあり得ないことを示している。具体的には、エージェントが扱える金額・データ・操作に硬い上限（ハードリミット）を設け、その閾値に達したら自動実行を止めて人間のループ（HITL/HOTL）へ昇格させる。Salesforceの「Einstein Trust Layer」が、エージェントのアクセス範囲、どの行動が人間の承認を要するか、いつエスカレーションすべきかをガードレールとして定義しているのはこの思想の実装例だ。

そして、HOOTLにこそ事後の監査と継続的な再検証が不可欠である。人間が実行時に見ていない以上、ログと監査証跡の完全性、定期的なシャドーテスト（人間や別系統と突き合わせる抜き取り検査）、ドリフト検知が、安全性を担保する唯一の手段になる。EU AI法が高リスクシステムに求める「使用中、自然人が効果的に監視できる設計」とは、必ずしも実行のたびに人間が立ち会うことではなく、監視・解釈・停止の能力が制度として保証されていることを意味する。HOOTLは「監視の放棄」ではなく「監視の様式の変更」なのである。

なお、生体認証など最も慎重を要する用途では、HOOTLは原則として認められない。EU AI法は付属書III・第1項(a)に該当する生体識別システムについて、システムの識別結果のみに基づいて行動・決定することを禁じ、必要な能力・訓練・権限を持つ少なくとも二名の自然人が別々に検証・確認する「四つの目の原則（four-eyes principle）」を義務づけている。どの領域でループから人間を外せるかは、技術的な可能性だけでなく、規制が引く一線によっても決まる。

人とAIの分業をどう設計するか ── リスクベースの「ループ選択」

三つのモードを理解したうえで、実務の中心的な問いは「どの判断を、どのループに割り当てるか」である。2026年に各コンサルティングファームが収斂しつつある答えは、リスクベースの動的なループ選択だ。すなわち、業務を一律にどれか一つのモードへ固定するのではなく、一件ごとのリスク（金額・不可逆性・規制・確信度）に応じて、HOOTL／HOTL／HITLを動的に切り替える。

設計の出発点は、業務をタスク単位に分解し、それぞれを二軸で評価することである。一つは「影響度と不可逆性」──失敗したときの損害の大きさと、取り消しの難しさ。もう一つは「AIの確信度と能力の成熟度」──そのタスクでAIがどれだけ安定して正答できるか。影響が小さく可逆で、AIが高確信度で処理できるタスクはHOOTLへ。影響は中程度だがAIの実行を任せられるタスクはHOTLへ。影響が大きい、不可逆、規制対象、あるいはAIの確信度が低いタスクはHITLへ──という割り当てが基本形になる。同じ「返金処理」でも、5,000円はHOOTL、5万円はHOTL、50万円や係争含みはHITL、と金額帯でモードを分けるのが典型例だ。

ここで効くのが、確信度に応じた自動エスカレーションである。AIが自らの確信度を出力し、それが閾値を下回ったら自動的に上位のループへ昇格させる。Decagonが採用する「解決単位課金（per-resolution）」モデル──会話が人間の介在なしに完全解決したときだけ高めの固定料金を課し、人間へのエスカレーションには課金しない──は、この分業思想を価格構造に落とし込んだ好例だ。AIが解いた分だけ課金され、人間に渡した分は課金されないため、ベンダーと顧客の利害が「適切なループ選択」に揃う。

McKinseyとDeloitteの調査が共通して突きつけるのは、この分業設計を支えるガバナンスの未成熟である。Deloitteの2026年版調査では、自律エージェントのガバナンスについて「成熟したモデルを持つ」と答えた企業は21%、すなわち五社に一社にとどまった。McKinseyの調査でも、戦略・ガバナンス・エージェンティックAIガバナンスの各領域で成熟度3以上に達した組織は約三分の一にすぎない。BCGが「AIエージェントは60%以上のコスト削減をもたらし得るが、それはプロセスをエンド・ツー・エンドで再設計したときに限る」と釘を刺すのも同じ問題意識だ。ループ選択は、既存業務にAIを「上から貼り付ける」のではなく、業務そのものを組み替える設計行為であり、そこにこそ価値とリスクの両方が宿る。

BCGはこの再設計需要を市場規模としても見積もっている。エージェントをERPやCRMといったレガシーシステムへ統合するために、テクノロジー・サービスに対して2,000億ドル（約32兆円）規模の新規需要が生まれるという。人とAIの分業設計は、各企業の内部問題であると同時に、巨大なサービス市場を生む経済現象でもある。

業務システムにおけるヒューマン・イン・ザ・ループ（HITL）、ヒューマン・オン・ザ・ループ（HOTL）、ヒューマン・アウト・オブ・ザ・ループ（HOOTL）の効果的な設計 - 人とAIの分業をどう設計するか ── リスクベースの「ループ選択」 - 図表1

二つの現場に当てはめる ── 人事システムとマーケティングのループ設計

人事とマーケティングは、ループ設計の観点では対極に位置する二つの現場である。人事は一件ごとの判断が個人の生活を左右し、規制が重く、取り消しのきかない決定が多いためHITLへ引き寄せられる。マーケティングは判断が高頻度かつ可逆で、一件あたりの損害が小さく、機械の速度がそのまま競争力に直結するためHOOTLへ引き寄せられる。だが、どちらの現場でも三つのモードは共存しており、「どのシーンをどの座標に置くか」を取り違えれば、人事では差別的・違法な決定を、マーケティングではブランド毀損を招く。

人事システムでは、勤怠の集計、有給残日数の算定、オンボーディング時のアカウント発行、規定内の経費精算といった定型処理がHOOTLの領域に入る。入力と出力の分布が安定し、誤っても容易に巻き戻せるため、人間が一件ずつ立ち会う必要はない。その一段上、応募書類の一次スクリーニング、シフトの最適化、研修コンテンツのレコメンドはHOTLが適する。AIが数千件の応募書類をランク付けし、リクルーターは合否ラインの境界付近やバイアスのフラグが立った候補だけを精査する──実行をAIに委ね、人間は監督に回る設計だ。そして採用の最終合否、解雇や懲戒、昇進・昇給・人事評価という、個人の人生に不可逆な影響を及ぼす決定は、例外なくHITLに置かねばならない。EU AI法は雇用・労務管理に用いるAIを高リスクに分類しており、これらをHOOTLに委ねることは設計上の誤りであると同時に法的リスクそのものである。ここで効くのが前章までに述べた「効きどころへの摩擦」だ。AIが「不採用」を推奨した候補ほど、人間が理由を確認して覆せる余地を残すことが、自動化バイアスによるラバースタンプ化を食い止める。

マーケティングシステムの重心は、逆にHOOTLへ大きく傾く。リアルタイムの広告入札、動的価格設定、レコメンドの出し分け、配信時刻やオーディエンス・セグメントの自動最適化、A/Bテストへの予算の自動配分は、いずれもミリ秒から分の単位で回り、誤っても次のサイクルで補正できる可逆な判断であるため、人間の介在を挟む方がかえって機会損失を生む。その一段上、キャンペーン予算のチャネル横断的な再配分や、生成AIによるクリエイティブの大量生成と出稿はHOTLが妥当だ。マーケターはCPAの急騰や配分の異常といった閾値超えだけを監督し、平時はエージェントに走らせる。一方で、HITLに留めるべきシーンも明確に存在する。プレスリリースやブランドキャンペーンのメインコピー、影響力の大きい公式SNSアカウントの発信、そして医薬・金融・景品表示法に触れる訴求がそれだ。これらはいったん世に出れば取り消せず、生成AIのハルシネーションや不適切表現がそのままブランド毀損や法令違反へ直結するため、AIが起案しても人間が公開前に必ず承認する。

両者を並べると、ループ設計を決めるのが業種ではなく「シーンの性質」であることがはっきりする。人事はHITL寄り、マーケティングはHOOTL寄りという重心の差はあっても、割り当てを決める軸は同じ──影響度・不可逆性と、AIの確信度・成熟度の二つだ。人事の中にもHOOTLで回してよい定型処理があり、マーケティングの中にもHITLを外せない発信がある。要は「人事だから慎重に、マーケティングだから任せる」と業種で一括りにすることではなく、同じドメインの内側でシーンごとにモードを割り当て、確信度が閾値を割った瞬間に上位のループへ自動で昇格させる動的な設計を、それぞれの現場に作り込むことである。

業務システムにおけるヒューマン・イン・ザ・ループ（HITL）、ヒューマン・オン・ザ・ループ（HOTL）、ヒューマン・アウト・オブ・ザ・ループ（HOOTL）の効果的な設計 - 二つの現場に当てはめる ── 人事システムとマーケティングのループ設計 - 図表1

周辺のソフトウェアとサービス ── エコシステムと資金の流れ

ループ設計を支えるソフトウェアとサービスは、2026年に厚い層を成すに至った。レイヤーごとに、主要なプレイヤーと、そこへ流れ込んだ資金を追っていく。

まずエージェントのオーケストレーション層では、LangChainのLangGraphが業界の事実上の標準になりつつある。LangGraphの強みは、華やかさはないが本番運用で必ず突き当たる問題──耐久性、リプレイ、そして人間による承認──を解いている点にあり、その中核が「interrupt（割り込み）」機能だ。これはエージェントの実行を文脈を失わずに一時停止し、人間の承認を待って再開する仕組みで、HITL/HOTLをコードレベルで実装する基盤になる。LangGraph Platformを通じて本番でエージェントを運用する企業は約400社にのぼり、Cisco、Uber、LinkedIn、BlackRock、JPMorganといった名が並ぶ。Anthropicが提供する公式のエージェントSDK（Claude Codeと同じアーキテクチャ）も、ツール使用、フック、MCP連携、サブエージェントといった本番グレードの部品を備え、急速に採用を広げている。なお、AI開発の評価基盤を手がけてきたHumanloopのチームは2026年にAnthropicへ合流した。

人間の専門知をループに供給する層、すなわちデータ・ラベリングとAI訓練の領域は、2025〜2026年に資金調達の規模が一段跳ね上がった分野だ。象徴的なのがMercorである。三人の当時22歳の大学中退者が創業した同社は、科学者・医師・弁護士といった高度専門家をAIラボに仲介し、モデル訓練のための人間の判断を供給する「ヒューマン・イン・ザ・ループ」プラットフォームを運営する。2025年10月27日、Felicis Venturesが主導するシリーズCで3.5億ドル（約560億円）を調達し、評価額は100億ドル（約1.6兆円）へと一気に5倍化した（Benchmark、General Catalyst、Robinhood Venturesも参加）。同社は3万人超の専門家を抱え、契約者への支払いは1日あたり150万ドル（約2.4億円）、平均時給は85ドル（約1.4万円）に達するとされ、年換算売上は4.5億〜5億ドル規模へ駆け上がったと投資家に説明している。

データ・ラベリングの老舗であるScale AIは、2024年5月のシリーズFで10億ドル（約1,610億円）を評価額138億ドル（約2.2兆円）で調達し、2025年6月にはMetaからの出資を受けて評価額は290億ドル（約4.7兆円）超とされた。ただしMeta出資後の中立性への懸念から、GoogleやOpenAIといった一部の大手ラボが取引を見直したと報じられており、その間隙をMercorらが突いた構図だ。一方、2021年の創業以来ブートストラップで黒字を続けてきたSurge AIは、2024年に年換算売上12億ドル（約1,930億円）を上げたとされる異色の存在で、2025年7月に初の外部調達に乗り出した。この調達の評価額についてはReutersが150億ドル（約2.4兆円）超、Bloombergが250億ドル（約4.0兆円）以上での約10億ドル調達の協議と報じており、媒体によって数値に開きがある。J.P. Morganが既存株主の売出し（セカンダリー）を含む取引を仲介したとされる。

顧客対応エージェントの層は、HITL/HOTLの設計思想が製品の差別化要因として最も先鋭化している分野だ。Sierraは2026年5月、GVとTiger Globalが主導するシリーズEで9.5億ドル（約1,530億円）を調達し、ポストマネー評価額は158億ドル（約2.5兆円）に達した。同社の年換算売上（ARR）は2025年末の約1.3億ドルから2026年5月に2億ドル（約320億円）へ伸びた。競合のDecagonは、2026年1月にCoatue ManagementとIndex Venturesが主導する2.5億ドル（約400億円）のシリーズDを経て評価額45億ドル（約7,200億円）となった。両社に共通するのは、AIが確信度・ポリシー・ワークフロー設計上の必要に応じて人間へエスカレーションする設計であり、買い手が問うべきは「ハンドオフ後に人間へ文脈が引き継がれるか」「引き継ぎ後の結果が分析に還流するか」だと整理されている。HITLの質そのものが製品の競争軸になっているのだ。

ソフトウェア開発の層では、自律の度合いをめぐる二つの思想が正面からぶつかっている。一方はIDE中心の「人間を運転席に残す」設計で、その代表がAnysphereのCursorだ。Cursorはコマンド実行の前に必ず人間に確認を取る同期的なフィードバックループを保ち、2026年2月時点で年換算売上20億ドル（約3,200億円）に達した。2025年11月のシリーズDでは23億ドル（約3,700億円）を評価額293億ドル（約4.7兆円）で調達している。そして2026年6月16日、SpaceXがAnysphereを全額株式交換・総額600億ドル（約9.7兆円）で買収すると発表した。これはベンチャー投資を受けたスタートアップの買収として史上最大規模と報じられ、SpaceXは同年4月21日に600億ドルでの買収権（オプション）を確保していた。もう一方は「人間を内側のループから外す」エージェント中心の設計で、CognitionのDevinがその純化形だ。Devinは自前のクラウドVM上で多段タスクを計画し、コードを書き、テストを走らせ、プルリクエストを出すところまでを人間の常時監督なしに完結させる。Cognitionは2026年5月27日、Lux Capital、General Catalyst、8VCが主導する調達で10億ドル超（約1,610億円）を調達し、プレマネー250億ドル・ポストマネー260億ドル（約4.2兆円）の評価額となった。同社の年換算売上は4.92億ドル（約790億円）で、自社にコミットされるコードの89%をDevin自身が書いている（2025年12月時点では13%）という数字が、エージェント中心思想の到達点を物語る。

そして全レイヤーを下支えするのが、エージェント・オブザーバビリティと評価の層だ。HOTLの監督もHITLの学習回収も、ここがなければ機能しない。LangSmithはLangChain／LangGraphアプリ向けに最も詳細なトレースとエージェントのグラフ可視化、人間レビュー用のアノテーション・キューを提供する。Galileoは自律エージェントの全ライフサイクルを評価する基盤で、開発時に定義したメトリクスをそのまま本番のガードレールへ転用でき、独自のLuna-2モデルにより全トラフィックに対しLLM評価比97%安価にメトリクスを走らせると謳う。このほかLangfuse（オープンソース）、Helicone、Arize AX、Braintrust、Latitudeなどが、評価・監視・人間レビューのそれぞれに強みを持って競合している。業務システム側でも、SalesforceのAgentforce（Einstein Trust Layer）、AIエージェントの構築・管理でGartnerの2025年クリティカル・ケイパビリティ評価の首位に立ったServiceNow、バックオフィス自動化のUiPathやAutomation Anywhereが、ガードレールと人間承認のワークフローを標準機能として組み込みつつある。

業務システムにおけるヒューマン・イン・ザ・ループ（HITL）、ヒューマン・オン・ザ・ループ（HOTL）、ヒューマン・アウト・オブ・ザ・ループ（HOOTL）の効果的な設計 - 周辺のソフトウェアとサービス ── エコシステムと資金の流れ - 図表1

シリコンバレーはどう論じているか ── コンサル・VC・各紙の視点

主要なコンサルティングファームとVCは、2026年のループ設計をどう論じているか。論調を並べると、表現は違えど一つの方向へ収斂しているのが見えてくる。

McKinsey は2026年の旗艦レポートを「State of AI trust in 2026: Shifting to the agentic era（エージェンティック時代への移行）」と題し、責任あるAI（RAI）の平均成熟度スコアが2025年の2.0から2026年に2.3へ上がった一方、ガバナンスと組織的な足並みが技術の進歩に追いつけていないと指摘する。同社は人間の役割が「ループの中（in the loop）」から「ループの上（above the loop）」へ進化すると述べ、AIが実行を担い、人間は監督・判断・問題解決・オペレーション能力を上から重ねる構図を描く。

Deloitte の論調はより警戒的で、2026年版レポートの主旋律は端的に「エージェンティックAIはガードレールより速く規模拡大している（scaling faster than guardrails）」である。最も懸念されるリスクはデータのプライバシーとセキュリティ（73%）、次いで法務・知財・規制対応（50%）、ガバナンス能力と監督（46%）と続き、上位がすべてガバナンスに関わる点が特徴的だ。

Gartner は冷や水を浴びせる役回りを引き受けている。同社は2025年6月25日のプレスリリースで、エージェンティックAIプロジェクトの40%超がコスト高騰・不明確な事業価値・不十分なリスク統制を理由に2027年末までに中止されると予測した。さらに、既存のチャットボットやRPAを「エージェント」と呼び替えるだけの「エージェント・ウォッシング（agent washing）」が横行しており、数千を称するエージェント・ベンダーのうち実体を伴うのは約130社にすぎないと切り捨てる。2026年版の「Hype Cycle for Agentic AI」では、中核技術と並んでエージェンティックAIガバナンス、エージェンティックAIセキュリティ、エージェント向けFinOpsといった統制・コスト系のプロファイルが立ち上がってきたことを、説明責任と経済的持続性への企業の関心の高まりの表れだと位置づけている。

BCG は実装と価値創出の側から論じる。同社の2026年の主張は、AIエージェントは60%超のコスト削減を可能にするが、それはプロセスのエンド・ツー・エンドの再設計を伴ったときに限られ、すでに測定可能な生産性向上を得た企業でも60%が「規模での価値解放」に至っていない、というものだ。そのうえで、リーダーは企業のリスク許容度にAIの行動を合わせるために、明示的なHITLおよびHOTLのプロトコルを確立すべきだと説く。

a16z をはじめとするVCは、最も強気に「実行のAIへの移譲」を語る。a16zは2026年に「記録のシステム（system of record）」が主役の座を失い、AIが運用データを直接読み書き・推論する「知能のシステム（system of intelligence）」へと重心が移ると予測する。VC Cafeは2026年を「エージェント従業員（Agent Employee）の年」と名付け、Theory VenturesのTomasz Tunguz氏は2026年末までにAIエージェントが8時間以上の作業ストリームを自律実行するようになると見る。

これらの論調を貫く対立軸を最も鮮明に言語化しているのが、業界メディアのdiginomicaだ。同メディアは「2026年は『human-in-the-loop』から『humans-above-the-loop』へ移行する年だ」と題し、「human in the loop」という言葉が本来は責任と協働を示すはずだったのに、実際には人間を機械のワークフローの内側に押し込め、チェックポイントや検証役、実行の最終工程として使ってしまったと批判する。ソフトウェアが自律的に動けるようになれば、人間はワークフローの内側ではなく上に立ち、判断・専門性・ニュアンス・創造性・共感を提供すべきだ、という主張である。別の論考ではさらに辛辣に、「人間をループに一人放り込んで、それをガバナンスと呼ぶ」やり方を、AIの説明責任が死にに行く場所だと評している。HITLを「免罪符」として濫用することへの警鐘は、シリコンバレーの内部からも上がっているのだ。

業務システムにおけるヒューマン・イン・ザ・ループ（HITL）、ヒューマン・オン・ザ・ループ（HOTL）、ヒューマン・アウト・オブ・ザ・ループ（HOOTL）の効果的な設計 - シリコンバレーはどう論じているか ── コンサル・VC・各紙の視点 - 図表1

注意点と課題 ── 自動化バイアス、「ラバースタンプ」、エージェント・ウォッシング

ループ設計の最大の落とし穴は、技術ではなく人間の心理にある。自動化バイアス、すなわち機械が自信ありげに答えるほど「アルゴリズムが正しいに違いない」と反射的に信じてしまう傾向は、HITLを内側から空洞化させる。人は自動システムに判断を委ねるほど独立した吟味を減らし、行動すべきときにしない「不作為の誤り」と、誤った助言に従う「作為の誤り」の両方を犯す。オーバーサイト研究でしばしば引かれる臨床試験では、意図的にバイアスをかけたAIの助言を与えられた450人の臨床医の診断精度が73%から61.7%へ低下した。彼らが正解を知らなかったからではなく、システムに譲歩したからである。承認画面の前に人間が座っていても、その人間が中身を見ずに通すなら、HITLは「速く、効率的で、そして破滅的に脆い」追認装置──すなわちラバースタンプ（rubber stamp）──に堕する。

この問題への処方箋は、前述したベストプラクティスの裏返しである。効きどころに摩擦を設計し、確信度を可視化し、承認に理由づけを要求する。研究者が提唱するのは、エージェンシー（行為主体性）を階層として扱う設計だ──タスク実行におけるAIの「操作的エージェンシー」と、検証・操舵・代替における人間の「評価的エージェンシー」を分離し、人間が実質的な決定権を持ち、AIの推論を理解し、意味のある形で覆し再方向づけできる状態を保証する。EU AI法第14条が、監視者が自動化バイアスに自覚的であることまで明文で求めているのは、形式的な人間関与が容易に形骸化するという現実認識に立っているからだ。

第二の課題は、ガバナンスの構造的な遅れである。Deloitteの21%、McKinseyの約三分の一という数字が示すのは、エージェントの自律性が、それを統制する仕組みの整備を追い越してしまっている現実だ。GartnerはCTO・CIOにとって最大のボトルネックがモデル性能ではなくガバナンスになると見ており、2026年に多くの企業が「エージェントのガバナンス危機」に直面すると予測する。権限・監査・停止の設計を後回しにしたまま自律性だけを上げれば、HOTLは「監督しているつもり」の状態に、HOOTLは「誰も見ていない」状態に容易に転落する。

第三が、「エージェント・ウォッシング」と幻滅期だ。Gartnerが指摘する通り、市場には実体の伴わない「エージェント」を称する製品が溢れ、初期の概念実証（PoC）の多くは過熱した期待に駆られて誤用され、規模化のコストと複雑さを見誤って頓挫していく。2027年末までに40%超のプロジェクトが中止されるという予測は、悲観論ではなく、過剰な自律化と過小なガバナンスのギャップが清算される過程の見積もりと読むべきだろう。生き残るのは、ループ設計とガバナンスを最初から織り込んだプロジェクトである。

業務システムにおけるヒューマン・イン・ザ・ループ（HITL）、ヒューマン・オン・ザ・ループ（HOTL）、ヒューマン・アウト・オブ・ザ・ループ（HOOTL）の効果的な設計 - 注意点と課題 ── 自動化バイアス、「ラバースタンプ」、エージェント・ウォッシング - 図表1

今後の展望 ── いつ、何が起きるか

時間軸を引くと、いくつかの節目が見えてくる。

直近で最も確度の高い転換点は、2026年8月2日だ。この日、EU AI法の高リスクAIシステムに関する主要条項（第6条〜第15条、人間による監視を定めた第14条を含む）が適用義務化される。EU市場で高リスク用途のAIを展開する企業にとって、HITL/HOTLの設計はベストプラクティスから法的要件へと格上げされる。生体識別における「二名による別個の検証」のような具体的な義務も発効し、ループ設計はコンプライアンスの直接の対象になる。

2026年の通年は、各VCが「エージェント従業員の年」と呼ぶ通り、自律性の比率が上がり続ける局面である。Gartnerはエンタープライズアプリの40%が2026年末までにエージェントを内蔵すると見込み、自律型AI・エージェントソフトウェアの専用市場は2026年に約118億ドル（約1.9兆円）に達するとの予測もある。同時にDeloitteの言う「ガードレールより速い規模拡大」が現実の摩擦を生み、ガバナンスへの投資が後追いで急増する。McKinseyやa16zが描く「ループの上（above the loop）」への移行、すなわち人間の役割が一件ごとの承認から方針設定と例外処理へ移るシフトが、先進企業を中心に本格化するのもこの時期だ。

2026年後半から2027年にかけては、二つの相反する力が同時に働く。一つは、HOTLが支配的なモードへ定着し、エスカレーションのルーティングが高度化し、Insight Partnersが予言する「ミリオン・エージェント問題」とそれを解く技術が立ち上がる、拡大の力。もう一つは、Gartnerが警告する40%超のプロジェクト中止という、淘汰の力である。この二つは矛盾しない。過熱したPoCが整理されると同時に、ループ設計とガバナンスを作り込んだ本物のエージェント基盤が本番へ移行していく──2027年は、その選別が表面化する年になる可能性が高い。「エージェント・オペレーション」という新しい職能が組織図に現れ、一人の人間が数十体のエージェントを監督する働き方が、一部の運用成熟した企業で標準になり始めるのもこの局面だろう。

通底するのは、人間がループから消えるのではなく、ループの中の「位置」を変え続けるという構図だ。実行の細部からは退きつつ、判断・監督・責任という、より高い位置へと移っていく。HITL・HOTL・HOOTLは、その移動の途中段階を指し示す座標である。どのタスクを、いつ、どの座標に置くか──それを意図的に設計し、自動化バイアスとガバナンスの遅れという二つの重力に抗い続けられるかどうかが、2026年から2027年にかけての業務システムの成否を分ける。

業務システムにおけるヒューマン・イン・ザ・ループ（HITL）、ヒューマン・オン・ザ・ループ（HOTL）、ヒューマン・アウト・オブ・ザ・ループ（HOOTL）の効果的な設計 - 今後の展望 ── いつ、何が起きるか - 図表1

業務システムにおけるヒューマン・イン・ザ・ループ（HITL）、ヒューマン・オン・ザ・ループ（HOTL）、ヒューマン・アウト・オブ・ザ・ループ（HOOTL）の効果的な設計

「ループ」という言葉が業務システムの中心概念になった2026年

三つのループ ── HITL・HOTL・HOOTL とは何か

ヒューマン・イン・ザ・ループ（HITL）のベストプラクティス

ヒューマン・オン・ザ・ループ（HOTL）のベストプラクティス

ヒューマン・アウト・オブ・ザ・ループ（HOOTL）のベストプラクティス

人とAIの分業をどう設計するか ── リスクベースの「ループ選択」

二つの現場に当てはめる ── 人事システムとマーケティングのループ設計

周辺のソフトウェアとサービス ── エコシステムと資金の流れ

シリコンバレーはどう論じているか ── コンサル・VC・各紙の視点

注意点と課題 ── 自動化バイアス、「ラバースタンプ」、エージェント・ウォッシング

今後の展望 ── いつ、何が起きるか

関連サービス

関連投資家

関連記事

業務システムにおけるヒューマン・イン・ザ・ループ（HITL）、ヒューマン・オン・ザ・ループ（HOTL）、ヒューマン・アウト・オブ・ザ・ループ（HOOTL）の効果的な設計

バーティカルAI（法律・会計・建築・製造・医療など）の可能性

迷走を続けるMicrosoft Copilot

中国、日本向けに半導体材料ガス、六フッ化タングステン（WF6）の原料となるタングステン粉末の輸出を停止。関東電化工業（4047）、セントラル硝子（4044）

ラピダス（Rapidus）、2ナノ先端半導体の顧客開拓に向け、イタリアの半導体設計機関 Chips-IT財団（Fondazione Chips-IT）と基本合意（MOU）