xAIがGrok Buildをリリース。Claude Codeに対抗

Grok Build とは何か

xAI が 2026 年 5 月 14 日に公式ブログ「Introducing Grok Build」で公開した Grok Build は、開発者のターミナル内で動作する「エージェンティック CLI」である。同社はこのツールを「プロフェッショナルなソフトウェアエンジニアリングおよび複雑なコーディング作業のための、強力で新しいコーディングエージェントおよび CLI」と位置付けている。Engadget や DevOps.com、CIO Dive など複数の媒体が、これを Anthropic の Claude Code、OpenAI の Codex CLI、Google の Gemini Code Assist と並ぶ「第四極」として報じた。

技術的なエントリポイントはシンプルで、開発者はプロジェクトフォルダ内で Grok Build を起動し、自然言語でタスクを記述する。エージェントはリポジトリ構造を解析し、関連ファイルを特定し、シェルコマンドを実行し、複数ファイルにまたがる編集を行う。CLI を基本としつつオプションで Web UI も用意されており、ターミナルを「ワークベンチ」として使う開発者の習慣を尊重した設計になっている。アクセスは現在、月額 300 ドル（約 4.5 万円）の SuperGrok Heavy サブスクライバーに限定された早期ベータ版だが、xAI は最初の 6 か月間を月額 99 ドル（約 1.5 万円）とする 67% 割引のプロモーションも併行して提供し、競合のユーザー層を自社エコシステムへ引き込もうとしている。

ローンチに合わせてイーロン・マスク氏は自ら X（旧 Twitter）上で複数回にわたり「公開ベータテスターを募集する」と発信し、Grok Build の利用ガイドを共有して個人的に推進している。Grok 4.3 という汎用モデルが一般・エンタープライズ用途を担い、Grok Build 0.1 が開発者・エージェント領域を担うという、xAI の二正面戦略が明確になった瞬間でもあった。

詳細機能と技術アーキテクチャ

Grok Build の最大の特徴は、最大 8 つの並列サブエージェントを「Plan（計画）→ Search（探索）→ Build（構築）」という 3 段階のワークフローで同時に走らせる点にある。sdd.sh の技術解説によれば、各サブエージェントは Git の worktree 機能と統合されており、独立したブランチ上で実験を行い、後でメインのワーキングツリーへマージできる。xAI 内部では「xai-fast-worktree」というクレートが btrfs サブボリュームを利用してコピーオンライト方式の worktree を高速に生成する仕組みを持ち、複数エージェントが同じファイルを「踏み合う」事故を構造的に防いでいる。

第二の柱が Plan モードである。Grok Build は複雑なタスクに対し、変更対象ファイル、各ファイルへの操作内容、その理由を含む完全な実行計画をまず提示する。開発者は計画を承認・コメント・全面的に書き換えることができ、承認後に初めて 1 行のコードも触れられる仕組みだ。これは「AI が暗黙のうちにファイルを破壊する」という、コーディングエージェント全般が抱える信頼性問題への xAI の解として打ち出された。

第三の柱は Arena モードだが、2026 年 2 月時点でコードベース内に痕跡が確認されたものの、公開された早期ベータでは未だ有効化されていない。完成すれば、並列に走る複数のエージェントの出力を自動でスコアリング・ランキングし、開発者がレビューする前に「最良の解」を選別する評価レイヤーとなる。xAI はこの機能を「近日中の追加」と明言しており、業界アナリストは Arena モードの実装が Grok Build の差別化の鍵を握ると見ている。

第四の柱がプライバシー設計である。Grok Build は「ローカルファースト」を掲げ、セッション中にユーザーのソースコードを xAI のサーバへ送信しない構造を採っている。コードはすべて開発者のマシン上で実行され、エアギャップ環境や規制業種の現場でも導入が検討できる設計だ。Anthropic の AWS Bedrock 経由でのデプロイのような複雑な企業向けインフラを必要としない点は、金融機関や防衛関連、医療など機微なコードベースを扱う企業からの早期関心を引いている。

エコシステム互換性も意識されている。Grok Build は Model Context Protocol（MCP）サーバを自動的にディスカバリーしてツールとしてエージェントに公開する仕組みを持ち、Anthropic 互換の Skills フォーマットを読み込む。さらに Claude Code 用の CLAUDE.md ファイル、もしくはクロスベンダー規約である AGENTS.md ファイルを認識する。社内ナレッジベース、独自 API、企業の MCP ゲートウェイなどを「Bring Your Own MCP」として直接プラグインできるという設計思想は、明らかに Claude Code のエコシステムからユーザーを横抜きする狙いを持つ。

性能面では Grok Build は grok-code-fast-1 をベースモデルとして採用している。256,000 トークンのコンテキストウィンドウ、SWE-Bench Verified で 70.8% という指標を持ち、API 料金は入力 100 万トークンあたり 0.20 ドル（約 30 円）、出力 100 万トークンあたり 1.50 ドル（約 225 円）と、Claude Opus 4.7 と比較してきわめて攻撃的な水準に設定された。なお xAI は 5 月 15 日付で grok-code-fast-1 を非推奨指定し、2026 年 8 月 15 日で完全リタイアするスケジュールを公式に告知している。これは後継モデル（業界では「Grok Code Fast 2」または Grok 5 ベースのコーディング派生と見られている）への移行を示唆するものだ。

強みと「Claude Code 一強」への挑戦のロジック

Anthropic の Claude Code は 2025 年 5 月の一般提供開始から 9 か月で年率換算売上 25 億ドル（約 3,750 億円）に到達し、Anthropic 製品全体のエンタープライズ売上の過半を稼ぐ規模に育った。SaaStr などの分析では、Anthropic の全社 ARR は 2026 年 4 月に 140 億ドル（約 2.1 兆円）に達し、エンタープライズ AI 採用率では同年 5 月に Anthropic が 34.4%、OpenAI が 32.3% と、初めて Anthropic が首位を奪取した。Claude Code はそのうちの「ChatGPT 級のキラーアプリ」として認知されている。

このような構造に対し Grok Build が打ち出す勝ち筋は、価格と並列性、プライバシー、そして xAI 単体での垂直統合の四点に集約される。月額 99 ドルのプロモは Claude Code の同等プランより明らかに安く、開発者個人での試用が容易だ。8 並列サブエージェントというアーキテクチャは「同一タスクを複数の解で並列に試し、その中から自動評価で最良案を抽出する」という、シングルエージェント中心の Claude Code に対して定性的に異なる開発体験を提供しうる。ローカルファースト設計は規制業種への直接侵入経路となる。そして xAI が Memphis Colossus（555,000 基の NVIDIA GPU、180 億ドル＝約 2.7 兆円、容量 2 ギガワット）という業界最大級の自社コンピュート基盤を持つことは、長期的に推論コストを内製で抑える余地を与えるという、戦略的に重い意味を持つ。

報道ベースの初期評価では、Techloy などの開発者向けメディアが「Grok Build は自律性タスクで Claude Code を上回り、コード生成精度では Codex CLI と並ぶ初期ベンチマークがある」と報じている。マスク氏自身が「マウスフレンドリーな CLI」「複数エージェントを行き来して計画を確認できる」というユーザー評価を X 上で再投稿しており、SNS 上ではある種の話題性は獲得した。

xAIがGrok Buildをリリース。Claude Codeに対抗 - 強みと「Claude Code 一強」への挑戦のロジック - 図表1

残された弱みと「一強構造」の根深さ

しかし sdd.sh や Beginners in AI 等の詳細レビューは、Grok Build が Claude Code の地位を即座に脅かす段階にはまだないと冷静に分析している。最大の弱みはベンチマーク差で、SWE-Bench Verified における 70.8% という数値は、Claude Opus 4.7 の 87.6% に対して 17 ポイント近い差をつけられている。Anthropic 自身は「エンジニアリングチームのコード生成量の 70〜90% を Claude Code が産んでいる」と社内導入で実証しており、内製でドッグフードを食べることでさらに性能を高めるフィードバックループに入っている。

エンタープライズ・ガバナンス層の差もきわめて大きい。Claude Code は SCIM プロビジョニング、Analytics API、ユーザー別の支出統制、OpenTelemetry エクスポート、そして Routines によるクラウド上での定時実行機能（cron トリガ、API webhook、GitHub イベントトリガで、ユーザーマシンを起動せず実行可能）まで備える。これらは Grok Build には現時点で存在しない。CLAUDE.md に相当する組織横断ルールの符号化機構は AGENTS.md として一応備わっているものの、エコシステムの厚みでは圧倒的に劣る。Claude Code は 6,400 以上の MCP サーバ（Jira、Figma、Salesforce など）の連携実績を抱え、PwC は数十万人規模で Claude Code を展開し 3 万人の研修を始めている。Grok Build が同等のサードパーティ密度を獲得するには相応の時間がかかる見込みだ。

評判の壁も無視できない。Netskope の AI Index（2026 年 5 月時点）によれば、ChatGPT と Claude が組織での広範な採用を獲得している一方、Grok はビジネス用途では限定的な利用にとどまっている。さらに 2026 年 1 月に Center for Countering Digital Hate（CCDH）が Grok の画像ツールで生成された数百万件のセクシュアル・ディープフェイクを問題視し、インドネシアとマレーシアが当該サービスをブロック、EU は Digital Services Act に基づく調査を開始した。エンタープライズの調達部門にとって、こうしたブランドリスクは依然として大きな障壁である。

xAIがGrok Buildをリリース。Claude Codeに対抗 - 残された弱みと「一強構造」の根深さ - 図表1

シリコンバレー VC の受け止め方

シリコンバレー最大手の Sequoia Capital は、Pat Grady 氏と Sonya Huang 氏による 2026 年 1 月のエッセイ「2026: This is AGI」において、コーディングエージェントを「AGI の最初の具体的なインスタンス」と明確に位置付けた。彼らは「coding と ChatGPT こそが AI の二大キラーアプリで、2026 年にはいずれも 2 桁億ドル規模の売上に近づく、もしくは超える」と予測しており、Grok Build はこの構造に xAI が遅れて参入したと見られている。Sequoia は agent エコノミーを「兆ドル規模の機会」と表現し、AI エージェントが「ソフトウェア予算ではなく労働予算（その 6 倍規模）」を取りに行く構造変化を強調している。Grok Build がこの予算プールに食い込めるかは未知数というのが、同社周辺の冷静な見立てである。

Andreessen Horowitz（a16z）は 2026 年 1 月の 34 億ドル（約 5,100 億円）のファンドを「AI アプリ・インフラ」へ集中投下しており、特に Cursor の親会社 Anysphere に対しては Series A、B、C と連続して主導するほどの強い確信を示してきた。Cursor は 2026 年 4 月時点で a16z と Thrive Capital が共同主導する 20 億ドル超（約 3,000 億円超）の調達ラウンドを 500 億ドル（約 7.5 兆円）の評価額で進行中で、Nvidia が戦略投資家として参加する。a16z のマーク・アンドリーセン氏は Joe Rogan のポッドキャストで「ボットは怒らない、酔わない、病まない、HR にクレームを入れない」と発言し、AI エージェントの代替性を強調する立場をとってきた。同氏が xAI 自体には間接出資ポジションを持つ可能性はあるものの、Grok Build に対する公式コメントは観測されておらず、a16z 視点ではむしろ Cursor および Anthropic への投資ポジションが Claude Code 経済圏の拡大によって含み益を生む構図にある。

Accel は、Anthropic（投資簿価 1,830 億ドル＝約 27.5 兆円が現在 8,000 億ドル＝約 120 兆円近くまで増価）と Cursor（93 億ドル＝約 1.4 兆円の評価から 500 億ドルへ）からの未実現リターンを背景に 50 億ドル（約 7,500 億円）の AI ファンドを新設した。Accel のような既存投資ポジションを持つ VC にとって、Grok Build の登場は「Claude Code 一強」を相対化することで Cursor の代替モデル選択肢を増やすという意味で歓迎要素であり、同時に Anthropic の評価額に対する短期的な逆風としても捉えられる、両義的な事象である。実際、Anthropic は 2025 年から 2026 年にかけて Cursor や Windsurf に対し Claude モデルへのアクセスを段階的に制限する措置を取ったことが VentureBeat により報じられており、独立系コーディングツール層にとっての「マルチモデル」の選択肢は確実に縮小している。Grok Build は xAI が独自モデルで CLI 層を抱える戦略の象徴であり、コーディングエージェント市場が「OpenAI／Anthropic／Google／xAI／Cursor＋Windsurf／GitHub Copilot」という垂直統合スタックへと収斂する流れを VC は確認している。

Sourcery Intel や Gartner の集計では、エンタープライズ向け AI コーディングエージェント市場は 2026 年 4 月時点で 98 億〜110 億ドル（約 1.5 兆〜1.7 兆円）の年率換算規模、広義の AI コーディングツール市場全体は 128 億ドル（約 1.9 兆円）に達したとされる。Grand View Research は 2034 年までに 1,392 億ドル（約 20.9 兆円）規模、年率成長率 40.5% の市場へ拡大すると予測している。この巨大な TAM を前にして、シリコンバレーの主流 VC は Grok Build を「市場拡大の起爆剤」として歓迎する一方、xAI 自体は a16z や Sequoia から見れば Anthropic や Cursor よりも投資ポジションが薄いため、コーディング領域での xAI の成功はむしろ自社ポートフォリオの希薄化要因となる可能性もある。それゆえ評価は冷静で、「並列サブエージェントと Arena モードは設計として面白いが、ベンチマークと企業ガバナンスの両方で Claude Code を抜くハードルは高い」（sdd.sh）というのが業界アナリストの共通見解だ。

xAIがGrok Buildをリリース。Claude Codeに対抗 - シリコンバレー VC の受け止め方 - 図表1

主要メディアの報道トーン

Engadget は事実関係を中心に「xAI が Claude Code に対抗するコーディングエージェントを投入した。SuperGrok Heavy（月額 300 ドル）専用」と淡々と報じた。DevOps.com は「coding agent race への xAI 参入」と位置付け、開発者向け業界紙の Techloy は「Grok Build が Claude Code を倒すために用意した 6 つの武器」というやや前のめりな構成で報じている。Slashdot のコメント欄は懐疑的な技術者の声が目立つ一方、Grok Build のローカルファースト設計を歓迎する意見も少なくない。

CIO Dive は CIO・調達責任者の視点で「Grok Build は plan・review・change の開発フローに特化しているが、競合は企業向けの幅広い適用範囲を提供している」「Gartner 調査では 80% の CEO がエージェンティック AI ツールが運用能力に意味ある変化をもたらすと回答」というエンタープライズ評価軸を提示した。同じ記事内で PwC が Claude Code を米国内数十万人へ展開していることに触れた構成は、Claude Code の地歩の固さを暗に強調している。

VentureBeat は Anthropic の Managed Agents が引き起こす「ロックイン」リスクを指摘する文脈で Grok Build の登場を相対化し、「マルチモデル時代の独立層が縮小している」点に警鐘を鳴らしている。Fortune は Cursor CEO Michael Truell 氏の発言を引用しつつ「Cursor は Claude Code に正面競合させられている。Anthropic は財務力とモデル提供者の優位を活かして低価格を出してくる」と報じ、Grok Build がこの戦線に xAI を参加させる構造変化として描いた。Wikipedia の Grok Build スタブ項目は 5 月 14〜15 日のローンチを公式記録として残し、SWE-Bench Verified 70.8% という指標を主要事実として記載している。

なお Bloomberg や Reuters、Wall Street Journal、Financial Times、日経新聞などのトップティア一次媒体による Grok Build 単独レビュー記事は本稿執筆時点（2026 年 6 月初頭）では確認できていない。これらの媒体が報じているのは主に SpaceX による xAI 買収（2026 年 2 月、xAI 評価額 2,500 億ドル＝約 37.5 兆円、合計 1.25 兆ドル＝約 188 兆円規模）や、Series E ラウンド（2026 年 1 月、200 億ドル＝約 3 兆円調達、評価額 2,300 億ドル＝約 34.5 兆円）といった親会社レベルの動きであり、Grok Build 単体への評価記事は開発者向け専門メディアと VC・アナリスト系媒体に集中している。これは「Grok Build はまだプロダクトとして B2B 取材対象として成熟していない」という市場の評価とも整合する。

今後想定される動き

xAI は Grok Build の早期ベータ段階で「日次の Release Notes を公開する」と明言しており、Basenor などの開発者向けニュースサイトはすでにこれを継続トラッキングしている。アナリストおよび VC が今後 3〜6 か月で注視する論点は明確だ。第一に Arena モードのライブ化時期と、その自動評価の質である。これが機能すれば「複数候補の自動評価＋採択」というワークフローが Claude Code の単一エージェントワークフローに対して定性的に異なる選択肢となる。第二に grok-code-fast-1 の後継モデルが SWE-Bench Verified で 80% 台を取れるかどうかで、Musk 氏が AGI 水準に近いと主張する Grok 5 ベースの派生モデルが秋までに登場するかが焦点となる。第三に MCP サーバの累積数とエンタープライズコネクタの拡充で、SAML/SCIM 等のガバナンス機能のロードマップ公開時期も含まれる。第四に Windows ネイティブビルドのリリース時期で、xAI はロードマップに掲載するも公式日付を出していない。

加えて、財務イベントとして注目すべきは Cursor の 20 億ドル調達ラウンドの最終クローズ（2026 年 Q2〜Q3 と想定）、および Anthropic が前回 3,800 億ドル（約 57 兆円）評価額の Series G から次回ラウンドへ向かう動向である。これらの数字に Grok Build の初期トラクションが間接的に影響するかは興味深い論点だ。仮に Grok Build が SuperGrok Heavy 経由で 1 万人規模の開発者をベータ期に獲得できれば、それは xAI の B2D（Business to Developer）戦略の足場として有意な数字となる。

そしてもう一つの不確定要素が、SpaceX 傘下化後の xAI の組織構造である。CNBC や TechCrunch によれば、買収後 50 名以上の研究者・エンジニアが離脱し、xAI は 4 つの主要開発チームへの再編を行った。Starlink VP の Michael Nicolls 氏が xAI 社長に就任した体制下で、Grok Build がリソース面で安定した投資を受け続けられるかは VC が継続的にウォッチする論点となる。Memphis Colossus が 100 万 GPU 体制を目指す中、xAI の「圧倒的コンピュート」戦略がコーディング領域でも武器として機能するか、それとも Anthropic の「アプリ層への深い埋め込み」戦略の前にスケールが空回りするのか。シリコンバレーの主要 VC は、Grok Build を「Claude Code 一強構造への最初の本格的挑戦状」として認識しつつも、勝敗の判定は最低でも 2026 年末、現実的には 2027 年前半のベンチマークと採用実績の積み上がりを待たねばならないと見ている。