第1章 なぜいまRAGは「Agentic」にならざるを得なかったのか

Douwe Kiela氏らがFacebook AI Research時代にarXivへ投稿した2020年の論文『Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks』が、現在のRAGという言葉の起源である。そこで提示された手順は後に「Naive RAG」と呼ばれるようになった――クエリをEmbeddingに変換し、ベクトル空間上で最近傍のチャンクをk件取得し、それをコンテキストとしてLLMに挿入する、というシンプルなパイプラインだ。2022年末のChatGPT登場以降、このNaive RAGはBugatti級の速度で普及したが、2023年から2024年にかけてエンタープライズの実装現場では三つの壁が明らかになった。
第一に、単一のEmbedding空間で全クエリを表現しようとする設計は、意図が混在する長いクエリや、複数ステップの推論を必要とする質問に対して構造的に脆弱であるという点である。第二に、ベクトル検索は「意味的に類似した」文書を返すのが得意な一方、「クエリに対して事実として正しい」文書を保証できない。第三に、企業データは非構造化文書だけではなく、SQLテーブル、ナレッジグラフ、API、リアルタイムイベントなどに分散しており、単一のベクトルDBに全てを詰め込むというアプローチ自体が非現実的だった。
学術界では2023年から2024年にかけて、この限界を破るための論文が連続して登場した。Asai et al.によるSelf-RAG(arXiv:2310.11511、2023年10月)は、LLM自身が「retrieveすべきか」「retrieveした結果は妥当か」を判定するreflection tokenという仕組みを導入し、検索するかどうかをモデル自身が動的に決める道を開いた。Yanらが2024年1月に発表したCRAG(Corrective RAG、arXiv:2401.15884)は、軽量な検索評価器が信頼度スコアを返し、低信頼時にはWeb検索を外部拡張として発動する設計を示した。Jeongらが2024年3月に発表したAdaptive-RAG(arXiv:2403.14403、NAACL 2024採択)は、クエリの複雑度を分類する小規模LMを前段に置き、単純クエリは検索なし、中程度のクエリは単発検索、複雑クエリは反復検索へとルーティングする三段構えを提案した。これらの論文は、ReActパターン(Yao et al.、arXiv:2210.03629、ICLR 2023)という「推論と行動をインターリーブする」基本設計の上に積み上げられており、2025年初頭までに事実上の業界標準を形成した。
この流れを2025年1月にSingh, Ehtesham, Kumar, Khoei, Vasilakosらが『A Survey of Agentic Retrieval-Augmented Generation for Large Language Models』(arXiv:2501.09136)として体系化し、RAGの進化を「Naive RAG → Advanced RAG → Modular RAG → Agentic RAG」の四世代として整理した。同論文は「Agentic RAGは、反省(reflection)、計画(planning)、ツール使用(tool use)、マルチエージェント協調といった設計パターンを埋め込むことで、検索戦略を動的に管理し、文脈理解を反復的に洗練させる」と定義している。
シリコンバレーのエンジニア視点でこの変化を要約すれば、Naive RAGは「関数呼び出し」であり、Agentic RAGは「プロセス実行」である。前者はクエリから答えへと一方向に流れるパイプラインだが、後者は状態とループを持ち、必要に応じてリトライ・ルーティング・ツール呼び出しを行う、OSプロセスに近い存在だ。Anthropicが2025年6月に公開したエンジニアリングブログ『How we built our multi-agent research system』では、Claude Opus 4をリーダーに、Claude Sonnet 4をサブエージェントとして配置したオーケストレータ・ワーカー型の構成が、単一エージェントのClaude Opus 4を内部評価で90.2%上回ったと報告されており、マルチエージェント構成の優位性を定量的に示した。同時に「マルチエージェントは標準的なチャットの約15倍のトークンを消費する」「トークン使用量がブラウジング評価における性能分散の80%を説明する」とも述べており、コストとの引き換えでしか得られない性能であることも率直に明かしている。
市場データもこの転換を裏書きする。Gartnerは2025年8月26日のプレスリリースで、2025年時点では5%未満だったタスク特化型AIエージェント搭載アプリケーションの比率が、2026年末までに40%へ跳ね上がると予測した。2028年時点ではエンタープライズソフトウェアの33%にエージェント型AIが組み込まれ、AIアプリの70%がマルチエージェント方式になるとも予測されている。MarketsandMarketsのレポートによるとRAG市場単体でも2025年の19.4億ドル(約2910億円)から2030年の98.6億ドル(約1兆4790億円)へCAGR 38.4%で拡大し、Grand View Researchの試算ではCAGR 49.1%で2030年に110億ドル(約1兆6500億円)に達する。ベクトルDB市場はMarketsandMarketsが2025年26.5億ドル(約3975億円)から2030年89.5億ドル(約1兆3425億円)へCAGR 27.5%で成長と見立てており、Fortune Business Insightsはエージェント型AI全体の市場規模が2026年の91.4億ドル(約1兆3710億円)から2034年の1391.9億ドル(約20兆8785億円)へCAGR 40.5%で爆発的に拡大すると予測している。これらの数字は、Agentic RAGを「一部のAIラボの実験」から「数兆円規模のインフラ市場」へと押し上げた。
第2章 Agentic RAGの中核技術と設計パターン

エンジニアがAgentic RAGを一行で定義するなら、「検索をツールとして呼び出すループを持ち、各ループで状態と意思決定を更新するシステム」である。この定義のなかに、少なくとも六つの独立した技術要素が織り込まれている。
第一の要素がクエリ・ルーティングとクエリ書き換え(rewriting)、クエリ分解(decomposition)、そしてHyDE(Hypothetical Document Embedding)である。ルーティングとは、ユーザーのクエリを受け取ったエージェントが、それをベクトルDBに投げるべきか、SQLクエリに変換すべきか、Web検索に回すべきか、あるいはナレッジグラフへのCypherクエリに翻訳すべきかを判断することである。書き換えは、ユーザーの口語的な表現を検索に最適なフォームに変換する工程で、しばしば小規模なLLMが使われる。分解は、「Aと比較してBはどう違い、Cはどう関連するか」といった複合質問を複数のサブクエリに分割する工程である。HyDEはGao et al. (2022) が提案した手法で、ユーザークエリに対する仮想的な回答をLLMに生成させ、その仮想回答文をEmbeddingして検索に使うことで、クエリと文書のスタイルギャップを縮める狙いがある。
第二の要素がハイブリッド検索である。2025年から2026年にかけて業界コンセンサスは「dense(密ベクトル)+ sparse(BM25/SPLADE)+ 再ランキング」の三層構造に収斂した。denseは意味的類似性を、sparseは語彙的一致性を捕捉し、互いの欠点を補う。NVIDIAがGitHubで公開しているRAG Blueprintリファレンス実装は、ElasticSearchとMilvusをプラガブルに切り替えながらdense+sparseのハイブリッド検索、マルチコレクション検索、GPU加速インデックス/クエリを提供しており、Reciprocal Rank Fusion(RRF)による融合を標準化している。Anthropicが2024年9月に公開した『Contextual Retrieval』は、チャンクを埋め込む前にClaudeで文脈説明文を前置するという前処理を加えることで、トップ20検索失敗率を単純Embedding比で35%削減、BM25併用で49%削減、再ランキング併用で67%削減するという衝撃的な結果を示し、RAGのインデキシング前処理の実装標準を一気に書き換えた。
第三の要素が再ランキング(reranking)である。dense検索とsparse検索で得られた候補集合に対して、よりコストのかかるクロスエンコーダをかけて順序を入れ替える工程で、Cohereが2024年9月にリリースしたRerank 3は4Kコンテキスト長を備え、同社は「Rerankは最も関連性の高い文書のみをRAGパイプラインとエージェントワークフローに渡し、トークン使用量を削減し、レイテンシを最小化し、精度を向上させる」と謳っている。BAAIが2024年3月に公開したBGE Reranker v2ファミリー(v2-m3、v2-gemma、v2-minicpm-layerwise)は、OSS陣営の標準として定着した。Omar Khattab氏らが提案したColBERT/ColBERTv2は「late interaction」という別のアプローチで、BERT品質を2桁低いFLOPsと2桁速いスループットで達成し、ColBERTv2ではストレージフットプリントを6-10倍削減している。
第四の要素が反省(self-reflection)と自己修正である。Self-RAGのreflection tokenや、CRAGの信頼度スコアリングはこの系譜に位置付けられる。実装面ではLangGraphが提供する条件付きエッジ(conditional edge)パターンが典型で、「検索結果が十分か」「生成結果が事実整合的か」を判定するノードを挿入することで、検索ループを動的に回す。LangGraphベースのAdaptive RAGではselective routingとvalidationを組み合わせることで、静的RAGと比較して幻覚を最大78%削減できると複数の実装ベンチマークで報告されている。
第五の要素がグラフRAG(GraphRAG)である。Microsoft ResearchのEdge et al.がarXiv:2404.16130で公開し、2025年2月にv2を出したGraphRAGは、LLMを使って文書群からエンティティ知識グラフを構築し、さらにコミュニティ検出とコミュニティ要約を事前計算するという二段構えのインデキシングを行う。これにより1百万トークン規模のコーパスに対する「global sensemaking」(全体傾向や網羅的な要約)型クエリで、純粋ベクトルRAGを包括性と多様性の両面で大きく上回る結果を得た。さらに2024年11月に発表されたLazyGraphRAGは、インデックス化コストをベクトルRAGと同等まで下げつつ(フルGraphRAGの0.1%)、クエリ時コストをGraphRAG Global Searchの700分の1にしながら同等の回答品質を達成し、同時に4%のクエリコストでグローバル・ローカル双方のクエリタイプでGraphRAGを上回るという、コスト/品質の両立を実現した。LazyGraphRAGは2025年中にMicrosoft DiscoveryとAzure Localに統合され、製品レベルでも実戦投入されている。
第六の要素が長期メモリと状態管理である。Harrison Chase氏が2026年4月に公開した論考『Your harness, your memory』は、エージェントの短期メモリ(会話内メッセージや大きなツール呼び出し結果)と長期メモリ(セッション横断の記憶)の分離、そしてメモリ管理をエージェント・ハーネス(harness)側に寄せるという考え方を明示した。彼はLangChain Deep Agentsで「ファイルシステムベースのワーキングメモリ」「段階的なスキル開示」「レイヤ化されたセキュリティ」を実装しており、「クローズドソースを選べば自分のデータのコントロールを失う」としてメモリ層のオープンソース化を強く主張している。これはOpenAIのResponses API(2025年3月発表)がhosted tool primitives(file_search、web_search、function calling)を抱え込みにいく戦略と鋭く対立する思想的分岐点であり、2026年のエージェントAI議論の中心的な論点を形成している。
これら六つの要素を統合した実装コストは2026年の本番環境では決して軽くない。独立系コンサルタントのJahanzaib氏が2026年初頭に公開した本番ガイドによれば、標準的なリトリーブのクエリあたり単価は0.06〜0.09ドル(約9〜14円)だが、複雑なマルチホップのAgentic RAGでは0.18〜0.31ドル(約27〜47円)まで跳ね上がる。中規模デプロイでベクトルストアが月50〜200ドル(約7500〜3万円)、全体で月2200〜3400ドル(約33万〜51万円)が相場であり、P95レイテンシは2.5秒以内に収めるのが目標とされる。検索バリデーションを追加するとクエリあたり2〜3秒のレイテンシが増えるものの、事実整合性が向上する。セマンティックキャッシングを併用すると高反復ワークロードで20〜35%のコスト削減、インテリジェントルーティングの併用で混在ワークロードのコストを30〜45%、レイテンシを25〜40%削減できる、というのが現場の相場観である。
第3章 フレームワーク/オーケストレーション層 ―― LangChain、LlamaIndex、CrewAI、そしてMicrosoft
Agentic RAGのアプリ層を実装するためのフレームワーク競争は、2025年秋に決着点のひとつに達した。LangChainは2025年10月20〜21日にIVP主導のシリーズBで1億2500万ドル(約187億5000万円)を調達し、ポストマネー評価額12億5000万ドル(約1875億円)でユニコーン入りを果たした。参加投資家はCapitalG、Sapphire Ventures、戦略出資者としてServiceNow Ventures、Workday Ventures、Cisco Investments、Datadog Ventures、Databricks Venturesが名を連ね、既存投資家のSequoia、Benchmark、Amplifyが追加投資を行った。Harrison Chase氏がSequoia Capitalのポッドキャスト『Context Engineering Our Way to Long-Horizon Agents』で語ったように、「3年前のsimple RAG chainから、LangGraphによる複雑なフローを経て、agent harnessへと最適実装は劇的に変わった」。この変化に対応してLangChain側もLangChain(基盤フレームワーク)、LangGraph(グラフ型オーケストレーション)、LangSmith(観測・評価)という三層の製品ポートフォリオを整備し、シリーズBと同時にLangChain+LangGraph 1.0を出荷した。Fortune誌への取材でLangChain広報は現状ARRが「12〜16百万ドル(約18億〜24億円)の範囲」と報じられる水準よりも「実態は低く、今の我々には見合わない数字」とコメントしており、成長軌道の実際の傾きはIVPが価格付けした12.5億ドルの評価額と整合するレベルまで加速していることを示唆している。Cisco、Replit、Clay、Cloudflare、Workday、ServiceNowといった既存顧客名が並ぶのも、観測・評価の有料プレーンがエンタープライズ調達のフックとして機能している証左である。
LlamaIndexは2025年3月4日にNorwest Venture Partners主導のシリーズAで1900万ドル(約28億5000万円)を調達し(Greylockが参加、総調達額2750万ドル/約41億円)、同時にLlamaCloudをGAとした。創業者のJerry Liu氏はCEOブログで「LlamaIndexはもはや単なるRAGフレームワークではなく、Agentic Document Processingの基盤になった」と宣言しており、抽象化の総合デパートから「長く使える最良のドキュメント・インフラストラクチャ」へと事業スコープを絞り込んだ。実際、LlamaCloudにはLlamaParse(ドキュメント解析)、AgentWorkflow(非構造化データに対するマルチエージェントのナレッジワーク)といった機能が組み込まれ、Salesforce、KPMG、Carlyle、Rakutenなど90社超のFortune 500を含む1万を超える組織がウェイトリスト入りしている。GitHubスター47K、月間ダウンロード520万(2026年3月時点)という数字は、ドキュメント特化型というポジションがフレームワーク横綱のLangChainと棲み分けを成立させている証拠だ。Jerry Liu氏は2026年初頭のニュースレターで「コーディング・エージェント(Claude Code、Cursor)はファイルシステムを中心に収斂しており、エージェントは5〜10個のコアツール+ファイルシステムアクセスだけで動く」との観察を述べており、Agent Composerのような軽量ツールセット設計の方向性を示唆している。
マルチエージェントのロール分担に振り切ったCrewAIは、2024年10月にInsight Partnersとboldstart venturesが主導する1800万ドル(約27億円)を調達した。2025年7月時点でLatkaが確認したARRは320万ドル(約4億8000万円)だが、プラットフォーム上で過去12ヶ月に実行されたエージェント実行数は20億回を突破し、Fortune 500の60%以上が顧客であると公表されている。製品アーキテクチャはrole-based agents with goals and tasks、つまり「マーケティング・リサーチャー」「分析官」「ライター」といった役割を人間組織のようにアサインして協働させる枠組みで、LangGraphより抽象度が高く、実装コードは短い。エンタープライズ・クラウドをGAにし、AWS/GCP/Azureのクロスクラウド配置とLLMベンダー非依存性を強調している。
ドイツのdeepsetが主導するOSSのHaystackは、2023年8月のBalderton Capital主導の3000万ドル(約45億円)のシリーズBが最新の主要調達で、2025年12月に製品ラインナップをHaystack Enterprise Platformとしてリブランディングした。ビジュアル・パイプラインエディタ、テンプレート、オンプレ展開を揃え、Airbus、The Economist、NVIDIA、Comcastといった欧州色の濃い大企業の顧客基盤を維持している。製造業や防衛産業でオンプレ要件を満たす選択肢としての地位を確立している。
MicrosoftはAutoGenとSemantic Kernelを統合し、2026年4月にMicrosoft Agent Framework 1.0を本番リリースした(2025年10月にパブリックプレビュー、翌年4月に正式版)。このフレームワークはAutoGenのエージェント抽象とSemantic Kernelのエンタープライズ機能(セッション状態、型安全性、ミドルウェア、テレメトリ)を接ぎ木したもので、グラフベースのワークフロー・オーケストレーション、マルチプロバイダー・モデルサポート、A2AとMCPのクロスランタイム相互運用性を備える。AutoGenは以後メンテナンスのみで、新規ユーザーはAgent Frameworkに誘導される形になった。Microsoftの統合は、Azureを使う企業にとっては事実上の標準ハーネスとなり、LangChainの事業モデルと真正面からぶつかる構造になっている。
OSSワークフロービルダー界隈では2025年に大型の統合が相次いだ。中国系のDifyはHSG(ヒルハウス)主導で3000万ドル(約45億円)のプレAを調達し、GitHubスター13万1000超、Maersk、Novartisを含む280社の企業顧客を擁する独立系の最後の砦となっている。一方、Flowiseは2025年8月にWorkdayに買収され、Langflowは同年早期にDataStax(現在はIBM傘下)に買収された。a16zやSequoiaが繰り返し指摘する「カテゴリー勝者が買収リスクに晒される局面」の典型的な進行が、ワークフロービルダー層で現実化している。
第4章 ベクトルDB/検索基盤層 ―― Pinecone、Weaviate、Qdrant、Chroma、Turbopuffer
Agentic RAGが本格的に回るためには、ベクトル検索の裏側にも大幅な進化が必要だった。2025年から2026年にかけてのこの領域の動きは、Silicon Valley最大のインフラ投資テーマの一つである。
Pineconeは事実上のカテゴリーキングとして2023年4月にa16z主導で1億ドル(約150億円)を評価額7.5億ドル(約1125億円)で調達した時点で頂点にあったが、オープンソースとハイパースケーラーの追い上げを受けて2025年に大きく動いた。創業者のEdo Liberty氏は2025年9月にCEOからChief Scientistに退き、「次世代のエージェント型AIシステムに向けた研究」へ専念することを発表。新CEOには元GoogleのグローバルセールスディレクターでAppDynamicsやActifioで幹部を務めたAsh Ashutosh氏が就任した。Liberty氏が好んで使うフレーズは「今後5年で、ベクトルDBは技術的なツールから、エンタープライズの長期メモリへと転換する」というもので、エージェントの長期記憶担当という新しいポジションを狙っている。2025年10月にThe InformationはPineconeがバンカーと組んで売却を検討中と報じ、想定価格は20億ドル(約3000億円)超、想定買い手としてOracle、IBM、MongoDB、Snowflakeの名が挙がった。LatkaのデータではPineconeの売上は2025年12月時点で1400万ドル(約21億円)、顧客数は約4000社にとどまっており、シリーズC時点の評価額に対してはARR倍率が明らかに伸び悩んでいる。製品面ではPinecone Assistantというエージェント構築APIを展開、サーバレスアーキテクチャへの刷新を進めつつ、MCPサーバーも提供開始している。
WeaviateはIndex Ventures主導の5000万ドル(約75億円)のシリーズB(2023年4月、Battery Ventures、NEA、Cortical、Zetta、ING Venturesが参加)以来、2026年4月時点で公式の追加調達を発表していないが、その間に製品側で加速した。2025年3月にWeaviate Agentsのフルスタック・ローンチを行い、同年9月にQuery AgentをGAにした。Query Agentの内部構造は興味深い――ユーザーのクエリを受け取ると、マルチコレクション・ルーティングを実行し、クエリ拡張・分解、フィルタ生成、再ランキングを単一のツール呼び出しで完結させる。これは「Agentic RAGを単一APIで提供する」という戦略的な抽象化であり、LangGraphのような外側のオーケストレータが不要になる設計でもある。2026年2月にはWeaviate Agent SkillsというOSSリポジトリを公開し、Claude Code、Cursor、GitHub Copilot、VS Code、Gemini CLIといったコーディングエージェントがWeaviate向けに最適化されたコードを生成できるようにした。Bob van Luijt CEOは「ベクトルDB、ベクトル埋め込みサービス、エージェント型アーキテクチャの台頭は、データマネジメントとデータ変換の進化における転換点だ」と語り、2026年1月にGigaOmから「Leader + Outperformer」、Gartnerから「Emerging Leader」と評価された。
ベルリン拠点のQdrantは2026年3月12日にAVP(Advance Venture Partners)主導のシリーズBで5000万ドル(約75億円)を調達し、Bosch Ventures、Unusual Ventures、Spark Capital、42CAPが参加、総調達額は約8780万ドル(約131億7000万円)に達した。Tripadvisor、HubSpot、OpenTable、Bazaarvoice、Boschといった実装事例を抱え、250M超のダウンロードとGitHubスター2.9万を擁する。Rustで書かれた実装の速度と、クラウド/オンプレ/ハイブリッドのどこでも動く「composable vector search」というポジショニングが、欧州系の保守的な企業と相性が良い。
ChromaはQuiet CapitalのAstasia Myers氏が主導する2025年10月14日のシリーズBで1800万ドル(約27億円)を評価額約7500万ドル(約112億5000万円)で調達した。ベクトル、全文、正規表現、メタデータの検索を単一のデベロッパーUXで提供するという設計で、ローカルファーストで組み込み利用できる軽さがインディ系RAG開発者とエージェント・アプリのプロトタイパーに支持されている。
Milvus/Zillizは2022年8月のシリーズB-II 6000万ドル(約90億円)以来の大型調達がない一方、製品面では依然として最大OSSマインドシェアを維持しており、GitHubスター4万を突破、NVIDIA、Salesforce、eBay、Airbnb、DoorDashなど1万社超の本番投入を持つ。特にアジア市場における影響力は大きい。
新興陣営ではTurbopufferの台頭が注目される。同社はex-Shopifyエンジニアのシモン・ヘラプ・エスキルセン氏とジャスティン・リー氏が共同創業したオタワ拠点のスタートアップで、2025年12月19日にLachy GroomとThrive Capital、および複数エンジェルから非開示額のシードラウンドを調達した。同社はAnthropic、Atlassian、Cursor、Notionを顧客とし、S3/GCS/Azure Blobといったオブジェクトストレージをファーストクラス市民として扱うサーバレス・ベクトルDBを提供する。centroid-optimizedのSPFreshインデックスを用いており、超大規模スケールでのGBあたりコストで他を圧倒する。シリコンバレーの文脈では「Anthropic、Cursor、Notionのような最前線のAIインフラ需要家が採用している」という事実そのものが、ベンチマークとして機能している。LanceDBも2025年6月24日にTheory Ventures主導のシリーズAで3000万ドル(約45億円)を調達し、Lance列指向フォーマット上の「AI-nativeマルチモーダル・レイクハウス」というポジションを確立した。
エンジニア視点でこの領域を俯瞰すると、ベクトルDBは三つのサブカテゴリーに分化しつつある。第一はマネージド・サーバレス型(Pinecone)で売却模索中、第二はOSSファースト+マネージドクラウド型(Weaviate、Qdrant、Chroma、Milvus)、第三はオブジェクトストレージ駆動型(Turbopuffer、LanceDB)。Pineconeの売却検討は、このカテゴリー全体が「ハイパースケーラーとOSSの挟み撃ち」局面に入ったシグナルと読まれている。
第5章 エンドツーエンド/Contextual系プラットフォーム ―― Contextual AI、Cohere、Vectara

Agentic RAGを「個別コンポーネントの寄せ集め」ではなく「一体設計された単一システム」として提供するというアプローチは、Contextual AIが最も先鋭的に体現している。創業者のDouwe Kiela氏は2020年のMeta RAG論文の筆頭著者そのものであり、スタンフォード兼任講師も務める。Contextual AIは2023年6月の2000万ドル(約30億円)のシードに続き、2024年8月にGreycroft、Bain Capital Ventures、Lightspeed、Lip-Bu Tan氏らが主導する8000万ドル(約120億円)のシリーズAを実現し、総調達1億ドル(約150億円)に達した。2025年1月にGAにしたContextual AI PlatformはRAG 2.0と呼ばれる設計思想に基づいており、リトリーバ、再ランキング、生成モデル(Grounded Language Model)の三者を別々に訓練して繋ぎ合わせるのではなく、共同で最適化するend-to-endのジョイント学習を施す。Contextual GLMはFACTSベンチマークで88%の事実整合性を達成し、Claude 3.5 Sonnet(79.4%)、GPT-4o(78.8%)を上回るとVentureBeatが報じた。最新の最先端RAGベンチマークでは71.2%を記録し、最も強力なベースライン(Cohere + Claude 3.5)の66.8%を上回る。HSBCやQualcommといったFortune 500顧客を獲得し、2026年1月にはエンタープライズのRAGを本番エージェントに変換するAgent Composerをローンチした。ただし、CB Insightsによる年間売上は1760万ポンド規模にとどまっており、評価額は依然として1.5億ドル(約225億円)前後とされる。この「技術的には圧倒的に先行しているが、ARRが追いついていない」というのがContextual AIの現在地であり、次ラウンドの水準が注目されている。
Cohereは『Attention Is All You Need』の共著者Aidan Gomez氏がCEOを務めるトロント拠点のカナダ企業で、エンタープライズLLMの旗手として急成長した。2025年8月にRadical Ventures/Inovia Capitalが主導する5億ドル(約750億円)の調達で評価額68億ドル(約1兆200億円)に到達、さらに9月には1億ドル(約150億円)のセカンドクローズで評価額70億ドル(約1兆500億円)へ押し上げ、AMD、NVIDIA、Salesforce Ventures、HOOPPが参加した。総調達額は16億ドル(約2400億円)超。2025年のARRは2億4000万ドル(約360億円)で当初目標の2億ドルを超過達成し、IPO経験のあるFrançois Chadwick氏をCFOに迎え、2026年のIPO候補として有力視されている。主力製品は111Bパラメータ・256Kコンテキストの旗艦モデルCommand A(2025年3月、Command R+ 08-2024比で150%スループット、A100/H100×2枚で動作)、エンタープライズ推論に特化したCommand A Reasoning(2025年8月)、4Kコンテキストで100言語超の再ランキングが可能なRerank 3.5、そしてエンタープライズ向けエージェント基盤の「North」である。CohereはOttogrid(旧Cognosys)を2025年5月に買収し、リサーチ・エージェント機能をNorthに組み込んだ。最大の差別化軸は「主権(sovereign)AI」「多言語」「VPC/オンプレ展開」の三点で、規制の厳しい金融・公的セクター、そして多言語対応が必要な欧州・日本のエンタープライズに刺さる構成を維持している。
Vectaraはシードで2850万ドル(約42億7500万円)、2024年7月にFPV VenturesとRace Capitalが主導するシリーズAで2500万ドル(約37億5000万円)を調達し、Samsung NextとFusion Fundが参加、総調達は5350万〜7350万ドル規模。Mockingbirdという幻覚低減に特化したLLMを擁する垂直統合型RAG APIで、規制業界での採用に焦点を当てる。2025年以降の新規調達は発表されておらず、小型の実装プラットフォームとしての地位を堅持している。
第6章 垂直特化のAgentic RAG ―― Harvey、Hebbia、Sierra、Decagon、Glean

水平的なプラットフォーム層と並行して、特定領域に特化した「垂直型Agentic RAG」が2025年から2026年にかけて最も大きな資本を集めた。各社のビジネスモデルと調達履歴を追うと、VCがどこに重点を置いているかが鮮明に浮かび上がる。
法務特化のHarveyは2024年のシリーズDに続き、2025年6月にKleiner Perkins+Coatue共同主導のシリーズEで3億ドル(約450億円)を評価額50億ドル(約7500億円)で調達し、2025年12月にa16z主導の1億6000万ドル(約240億円)で評価額80億ドル(約1兆2000億円)、2026年3月25日にGIC+Sequoia共同主導(Sequoiaは3度目の参加)で2億ドル(約300億円)を評価額110億ドル(約1兆6500億円)で調達した。総調達額は10億ドル(約1500億円)を突破。Harveyの2026年1月時点のARRは1億9000万ドル(約285億円)に達しており、2025年8月の1億ドル(約150億円)から半年で1.9倍に急伸した。顧客はAmLaw 100の過半、500超の社内法務チーム、50の資産運用会社、60カ国に広がる。Sequoiaは2026年3月のラウンドで「Agentic AIの垂直ユースケースのディフェンシブル性」を再確認した形であり、Harveyは2026年時点で垂直Agentic RAGの最重要プロキシとなった。
金融・法務のディープワーク特化を標榜するHebbiaは、2024年4月〜7月にa16z主導、Index Ventures、GV、Peter Thiel、Eric Schmidt、Jerry Yangらが参加する1億3000万ドル(約195億円)のシリーズBで評価額7億ドル(約1050億円)に到達した。当時のARRは約1300万ドル(約19億5000万円)で54倍マルチプル。顧客層は世界の大手資産運用会社の3分の1をカバーし、累計AUMは14兆ドル(約2100兆円)規模。主力製品のMatrixはスプレッドシート・グリッドUIで多エージェントのリトリーブ・グラウンド・ベリファイをネイティブに表現する設計で、2025年6月に再設計され、同月にFlashDocsを買収してスライド生成機能を内蔵した(現在1日1万件超のスライド生成)。Hebbiaは「deep workをAIエージェントに置き換える」というa16zのテーゼを最も忠実に体現する企業である。
Bret Taylor氏(OpenAI会長、元Salesforce共同CEO)とClay Bavor氏(元Alphabet)が創業したSierraは2024年10月の4.5億ドル評価の1億7500万ドル(約262億5000万円)調達に続き、2025年9月4日にGreenoaks Capital主導で3億5000万ドル(約525億円)を評価額100億ドル(約1兆5000億円)で調達、総調達6億3500万ドル(約952億5000万円)。ARRは2025年11月に1億ドル(約150億円)に達し、創業から7四半期での記録を更新、入年3で1億5000万ドル(約225億円)の年商ランレートに乗せた。顧客は数百社の大企業、うち20%以上が売上100億ドル超。Sierraはカスタマー・サービスに軸足を置きつつ、返金処理やチケット発行といった「実際に行動を起こす」レベルまで業務権限をエージェントに委譲できるブランド向けの校正ツールが強みで、Bret Taylorブランドの信頼が突出した差別化要因を形成している。
Decagonは2025年6月にAccel+a16z共同主導で1億3100万ドル(約196億5000万円)を評価額15億ドル(約2250億円)で調達し、わずか7ヶ月後の2026年1月28日にCoatue+Index Ventures共同主導で2億5000万ドル(約375億円)を評価額45億ドル(約6750億円)で調達した。評価額は半年強で3倍に跳ね上がり、「AI Concierge」という高接触のカスタマー・サービスAIとして定義し直す戦略が奏功している。2025年中に100社超の新規エンタープライズ契約を獲得しており、シリーズDラウンドにはBain Capital Ventures、BOND、Ribbit、Forerunner、Avra、A*、ChemistryVC、Definition Capital、Starwood Capitalが参加した。
エンタープライズ検索をAgentic AIへと拡張したGleanは、2024年9月のシリーズE 2億6000万ドル(約390億円)・評価額46億ドル(約6900億円)に続いて、2025年6月10日にWellington Management主導のシリーズFで1億5000万ドル(約225億円)を評価額72億ドル(約1兆800億円)で調達した。Khosla Ventures、Bicycle Capital、Geodesic Capital、Archermanが新規参加、既存投資家としてAltimeter、Capital One Ventures、Citi、Coatue、DST、General Catalyst、ICONIQ、IVP、Kleiner Perkins、Latitude、Lightspeed、Sapphire、Sequoiaが追加投資を行った。Gleanは権限認識型のエンタープライズSaaSコネクタ、Glean Agents、業務アシスタントを束ね、Reid Hoffman氏が語る「エージェント増幅(agent amplification)」の代表例としてSilicon Valley中枢で引用される存在となった。
同じく垂直系ではWriter.comが2024年11月12日にPremji Invest、Radical Ventures、ICONIQ Growth共同主導で2億ドル(約300億円)を評価額19億ドル(約2850億円)で調達、Adobe Ventures、B Capital、Citi Ventures、IBM Ventures、Salesforce Ventures、Workday Venturesが参加した。自社LLMのPalmyraファミリーとグラフ型RAG、ガードレール、ノーコードのエージェントビルダーを組み合わせ、ヘルスケア・小売・金融サービスの縦型パッケージを提供する。
エンタープライズLMS/ナレッジマネジメントのSana AIは2025年9月16日にWorkdayが11億ドル(約1650億円)で買収し、この領域での2025年最大級のエージェント買収案件として記録された。同じくworkflow builderのFlowiseもWorkdayが、LangflowはDataStax(現IBM)が取り込み、垂直SaaSベンダーによるAgentic RAGの企業内組み込みが急速に進んでいる。
第7章 MCPとエコシステム標準化 ―― なぜAnthropicはMCPをLinux Foundationに寄贈したのか
Agentic RAGの議論で2025年最大のアーキテクチャ事件は、Model Context Protocol(MCP)の業界標準化である。AnthropicがMCPを2024年11月に公開した時点では、一社のオープン仕様にすぎなかったが、2025年3月にOpenAIがAgents SDK、Responses API、ChatGPT desktopで採用を表明、同年4月にGoogle DeepMindも追従した。Python/TypeScript SDKの月間ダウンロード数は2026年3月時点で9700万に達し、公開されているMCPサーバーは1万を超えた。2025年11月25日にはasync操作、ステートレス性、サーバー識別、コミュニティ主導レジストリといった大幅なスペック更新が行われ、2025年12月にAnthropicはMCPをLinux Foundation傘下のAgentic AI Foundation(AAIF)に寄贈した。AAIFはAnthropic、Block、OpenAIが共同創設し、Google、Microsoft、AWS、Cloudflare、Bloombergがサポートしている。
MCPが標準化されたことで、Agentic RAGは「どのベクトルDBを使うか」より「どのハーネス/制御層を使うか」が競争軸に変わった。PineconeがMCPサーバーを提供し、Weaviate Agent Skillsがコーディング・エージェントとMCP越しに会話し、Anthropic自身がMCPを通じて数千のデータソースを使える状態を作り、LangChainとMicrosoft Agent FrameworkがどちらもMCPネイティブを謳う。この結果、データソース側のコネクタ価値は急速にコモディティ化し、価値はオーケストレーションとデータ統制の側にシフトした。Forresterはエンタープライズ・アプリ・ベンダーの30%が2026年末までにMCPサーバーを公開すると予測している。
これに対抗的なポジションを採るのがOpenAIのResponses APIで、hosted tool primitives(file_search、web_search、function calling)をOpenAI側で抱え込む戦略をとる。Responses APIのfile_searchはクエリ1000件あたり2.5ドル(約375円)、ストレージは1GBあたり1日0.10ドル(約15円)で、新規作成のベクトルストアは最大1億ファイルをサポートする(2025年11月の拡張で1万→1億)。AssistantsAPIは2026年8月26日に廃止となり、Responses APIに機能統合される。エンジニアが直面する選択肢は明確で、「OpenAI/Microsoftなどの抱え込み型エコシステムに乗るか」「MCP+LangChain/LangGraph/Agent Frameworkで自前の制御層を持つか」という、インフラの自己決定権をめぐる分岐点である。Harrison Chase氏が『Your harness, your memory』で「クローズドソースを選べば自分のデータのコントロールを失う」と書いたのは、まさにこの分岐に対するメッセージである。
第8章 シリコンバレーVCの資本配分と報道の論調

2025年のVC投資全体で、AI関連の調達総額は2024年の1140億ドル(約17兆1000億円)から75%増の2020億ドル(約30兆3000億円)超へと跳ね上がり、全VC投資の約半分を占めた。ユニコーン級のディールで最も多くの取引をリードしたのはSequoia(51件/21社のユニコーン)とa16z(50件/20社)の双子で、GreylockとBenchmark、Kleiner Perkins、IVP、Index Ventures、Accel、Lightspeed、Coatue、Insight Partners、General Catalystがこれに続く形でAgentic RAGスタックに深く関与している。a16zは2025〜26年で累計150億ドル(約2兆2500億円)超のファンドを組成し、米国VC投資額の18%を単独で動かしたと公言している。SequoiaはSoftBankやGoogle Venturesと並んで2026年4月に70億ドル(約1兆500億円)の新ファンドを発表し、AI投資を拡張すると表明した。
各VCが公開している思想文書を読むと、Agentic RAGに対する視線が鮮明に見える。a16zは2026年1月の『Big Ideas 2026』で「AI Data Transformation Layer」を基盤的スタートアップカテゴリーとして選び、RAGシステムが「矛盾した/古い情報源による幻覚と、エージェントのワークフローが微細かつ高コストに崩壊する問題」を指摘し、データ品質こそが真のボトルネックだと論じている。Sequoiaは『2026: This is AGI』で「長期ホライズンのエージェントは機能的にはAGIであり、2026年はその年になる」と宣言し、『AI in 2026: A Tale of Two AIs』ではコパイロットから自律エージェントへのシフトを強調している。Bessemer Venture Partnersは『AI Infrastructure Roadmap: Five frontiers for 2026』で「推論ワークロードが訓練に匹敵し、多くの場合それを上回る計算需要と経済的重要性を持つようになった」と分析し、TensorMesh(LMCache)、RadixArk(SGLangルーティング)、Inferact(vLLM)といったエージェント特化のインフラを注視していると明言している。
各紙の報道トーンも一定の収斂を見せる。TechCrunchは2025年10月21日の『Open-source agentic startup LangChain hits $1.25B valuation』でLangChainの内容を詳報、2026年3月25日の『Harvey confirms $11B valuation, Sequoia triples down』でSequoiaの垂直Agentic RAGに対する確信を強調、2026年4月16日の『New leaders, new fund: Sequoia has raised $7B to expand its AI bets』でSequoiaの資本コミットを追いかけた。The InformationはPinecone売却観測を早期に報じ、Bloombergは2026年1月28日に『AI customer support startup Decagon valued at $4.5 billion』で垂直エージェントの急成長を伝えた。CNBCは2025年6月10日の『Glean raises $150M at $7.2 billion valuation』で大手企業へのエージェント浸透を追った。Fortuneは2025年10月20日の独占取材でLangChainのARR感を開示し、VentureBeatはContextual AIのベンチマーク結果を繰り返し取り上げている。
2025〜2026年のVC資本配分を眺めると、明確な分岐が見える。フレームワーク層(LangChain、LlamaIndex、CrewAI)には数億ドル単位の資本が入ったものの、評価額は1〜2桁億ドル規模にとどまる。ベクトルDB層(Pinecone、Qdrant、Chroma)は5000万〜1億ドル規模の継続的な調達が続くが、カテゴリー王のPineconeが売却検討に入るなど、OSS+ハイパースケーラーに挟まれる圧力が出始めた。対照的に、垂直Agentic RAG(Harvey、Sierra、Decagon、Hebbia、Glean、Cohere)は単独で数億ドル〜10億ドル級の調達を連発し、評価額も45億〜110億ドルへ到達している。ARRと評価額の倍率を比較しても、垂直側の資本効率の方が明らかに高い。これはOpenAI、Anthropic、Google DeepMindがプラットフォーム側の知的優位を独占するなかで、VCは「基盤モデルの上で業務を取り切る垂直エージェント」に最も大きな経済価値が帰属すると読んでいる証左である。
批判的な視点も並行して登場している。Gartnerは2025年6月25日のプレスリリースで「エージェント型AIプロジェクトの40%超が2027年末までにキャンセルされる」との警告を発し、ガバナンスと観測可能性の欠如が主因とした。McKinseyの2025年秋の『State of AI 2025』レポートは、エンタープライズの80%以上がジェネレーティブAIの収益貢献をまだ実感していないとし、AIエージェントを個別機能でスケールに成功した組織は10%未満と指摘した。SaaStrのJason Lemkin氏は2025年の『SaaS Vibe Check』で「勝者はビルダーであると同時にストーリーテラーだ」と繰り返す一方、「観測・評価がない本番AIエージェントは時限爆弾」と警鐘を鳴らす。Anthropicのマルチエージェント評価が示した「標準チャットの15倍のトークン消費」という事実は、このコスト問題を象徴する数字として繰り返し引用される。
第9章 2026年後半から2027年にかけて予測される新たな動き
複数のVC、アナリスト、シンクタンクの予測を統合すると、今後12〜18か月で観測される動きの輪郭は比較的明瞭だ。
第一に、長期メモリとエージェント・ハーネスの標準化競争が本格化する。LangChainのDeep Agents、Microsoft Agent Framework 1.0、OpenAI Responses API、Anthropic Claude+MCP、Databricks Genie Codeという5つの主要ハーネスが、2026年後半から2027年にかけて「エージェントのOS」の座を競う。勝者が決まるまで数年かかるが、MCPがLinux Foundationに寄贈されたことで、少なくともコネクタ層は中立化された。2026年5月13〜14日にサンフランシスコで開催されるLangChainカンファレンス(Harrison Chase、Jensen Huang、Andrew Ng登壇)は、オープン系のハーネス陣営の結束を示す場となる。
第二に、垂直Agentic RAGの業界別カテゴリー・リーダーが確定していく。Harvey(法務)、Hebbia(金融)、Sierra(カスタマーサービス)、Decagon(カスタマーサービス/AI Concierge)、Glean(エンタープライズ検索)、Writer(コンテンツ)、Harvey競合となりうるSpellbook、EvenUp(保険・人身傷害)、Norm Ai(コンプライアンス)など、各業種で「この領域のAgentic RAGといえばここ」という単独寡占化が進む。Sequoia、a16z、Coatue、Index Venturesはこの段階で追加投資を続け、IPO水準まで持ち上げる見込みである。CohereはIPO候補の最右翼で、2026年Q2〜Q3が視野に入る。
第三に、ベクトルDB層の再編が加速する。Pineconeの売却が成立すれば、Oracle、IBM、Snowflake、MongoDBのいずれかがカテゴリーキングを抱え込み、OSS系のWeaviate、Qdrant、Milvusとの棲み分けが明確化する。一方、オブジェクトストレージ駆動型のTurbopufferやLanceDBがアリババ・AWS・Azureのネイティブ統合に進めば、「ベクトルDB独立カテゴリー」そのものが解体される可能性もある。Edo Liberty氏が語る「ベクトルDBはエンタープライズの長期メモリへ」という未来像が現実化するか否かが、2027年までに明らかになる。
第四に、評価と観測可能性のインフラが爆発的に成長する。LangSmith、Arize、Galileo、TruEra、Ragas、Phoenix、Braintrustといった評価・観測プラットフォームは、2025年から2026年にかけて既に二桁百万ドル規模の調達を続けているが、Gartnerの「40%がキャンセル」警告が示すとおり、エージェント型プロジェクトの成否を分けるのは結局「本番での挙動を観察し、品質を数値で管理できるか」にかかっている。2026年後半以降、AI Observabilityは独立カテゴリーとしてUniverseを形成すると見られる。
第五に、日本企業のエンタープライズAgentic RAGへの本格参入が予想される。Rakuten、NTTデータ、富士通、NEC、KDDI、SoftBank、メルカリ、LINEヤフーといった大手IT・通信系が相次いで法人向けAgentic RAG製品を発表するとの報道が相次いでおり、さらにNTTのtsuzumiや富士通のTakane、NECのcotomiといった国産LLMとCohereやClaudeなどの海外モデルを組み合わせたハイブリッド構成が主流になると見られる。政府調達の主権AI要件が整備されるにつれ、Cohereのような「主権AI」を謳うベンダーの日本市場でのプレゼンスが拡大する可能性が高い。
第六に、エージェント間の相互運用プロトコル(Agent-to-Agent、A2A)が次の標準化戦線になる。Microsoft Agent FrameworkがA2A+MCPのクロスランタイム相互運用を掲げ、他ベンダーも追従しており、AAIF(Agentic AI Foundation)がこの領域の共通仕様を整備する可能性がある。エージェントが別のエージェントにタスクを委譲・委託する仕組みが標準化されれば、Agentic RAGは「単体のエージェントによる検索」から「エージェントの生態系による検索」に進化する。Singh et al.のサーベイ論文が示した「マルチエージェント協調」の段階が、実装レベルで現実化するのは2027年あたりが有力だ。
第10章 結語 ―― Agentic RAGは「検索ツール」から「知的インフラ」へ
2026年4月時点でシリコンバレーのVC資本が教えてくれるのは、RAGという概念がすでに「検索ツール」の範疇を超え、エンタープライズにおける知的インフラそのものに進化しているという事実である。Pineconeの創業者Edo Liberty氏が語る「ベクトルDBはエンタープライズの長期メモリに転換する」という予言、Databricks共同創業者でACM Prize in Computing 2026受賞者のMatei Zaharia氏が語る「AGIは既にここにある。ただ、我々が評価する形で存在していないだけだ」という観察、Harrison Chase氏が主張する「ハーネスとメモリはオープンであるべきだ」という思想、Douwe Kiela氏が体現する「RAG 2.0として単一システムに統合された検索と生成」という工学的野心。これらが交差する点に、Agentic RAGという現在進行形のインフラ・レイヤーが立ち上がっている。
シリコンバレーのVCは、Agentic RAGを単なるAIのサブトピックではなく、エンタープライズソフトウェアの次の10年を決める地殻変動として見ている。IVPがLangChainに12.5億ドル評価を付け、Sequoiaがハービーに3度出資し、a16zがHebbiaとDecagonの成長をリードし、Coatueが垂直エージェントに継続的に賭け、Greycroft/Bain/LightspeedがContextual AIのRAG 2.0を支え、Wellington Managementが伝統的な資産運用会社としてGleanに入る――この多層的な資本配分のパターンは、Agentic RAGが「インフラ投資」「エンタープライズ・アプリケーション投資」「生産性投資」の三つの領域を横断する、極めて射程の広いテーマであることを示している。
一方で、Gartnerが予測する「40%のキャンセル」、Anthropicが報告する「15倍のトークン消費」、McKinseyが指摘する「10%未満のスケール実績」という現実は、バブルと期待の調整局面が避けられないことも示唆している。2026年後半から2027年にかけて、Agentic RAGは「どこでも動く魔法」という期待から、「明確なROIと観測可能性を伴う、業務プロセスに深く埋め込まれたインフラ」へと成熟していくはずだ。その過程で、勝者と敗者は鮮明に分かれる。シリコンバレーのエンジニアが今注視すべきは、特定のフレームワークやベクトルDBの選定そのものではなく、「どの制御層の上に自社の長期メモリを載せるか」という、より根源的なアーキテクチャ判断である。2027年にAgentic RAGを振り返ったとき、我々はそれを「AIアプリケーションの設計思想が、パイプライン型からプロセス型へと移行した転換点」として記憶することになるだろう。
Sources
- Singh, Ehtesham, Kumar, Khoei, Vasilakos, "Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG" (arXiv:2501.09136) — https://arxiv.org/abs/2501.09136
- Asai et al., "Self-RAG: Learning to Retrieve, Generate, and Critique through Self-Reflection" (arXiv:2310.11511) — https://arxiv.org/abs/2310.11511
- Yan et al., "Corrective Retrieval Augmented Generation" (arXiv:2401.15884) — https://arxiv.org/abs/2401.15884
- Jeong, Baek, Cho, Hwang, Park, "Adaptive-RAG" (arXiv:2403.14403) — https://arxiv.org/abs/2403.14403
- Yao et al., "ReAct: Synergizing Reasoning and Acting in Language Models" (arXiv:2210.03629) — https://arxiv.org/abs/2210.03629
- Edge et al., Microsoft Research, "From Local to Global: A Graph RAG Approach to Query-Focused Summarization" (arXiv:2404.16130) — https://arxiv.org/abs/2404.16130
- Microsoft Research, "LazyGraphRAG: Setting a new standard for quality and cost" — https://www.microsoft.com/en-us/research/blog/lazygraphrag-setting-a-new-standard-for-quality-and-cost/
- Microsoft Research, GraphRAG project — https://www.microsoft.com/en-us/research/project/graphrag/
- Microsoft Research, "BenchmarkQED: Automated benchmarking of RAG systems" — https://www.microsoft.com/en-us/research/blog/benchmarkqed-automated-benchmarking-of-rag-systems/
- Anthropic Engineering, "How we built our multi-agent research system" — https://www.anthropic.com/engineering/multi-agent-research-system
- Anthropic, "Introducing Contextual Retrieval" — https://www.anthropic.com/news/contextual-retrieval
- Anthropic, "Introducing the Model Context Protocol" — https://www.anthropic.com/news/model-context-protocol
- Anthropic, "Donating the Model Context Protocol and establishing the Agentic AI Foundation" — https://www.anthropic.com/news/donating-the-model-context-protocol-and-establishing-of-the-agentic-ai-foundation
- Model Context Protocol Specification 2025-11-25 — https://modelcontextprotocol.io/specification/2025-11-25
- NVIDIA Developer Blog, "Traditional RAG vs Agentic RAG — Why AI Agents Need Dynamic Knowledge to Get Smarter" — https://developer.nvidia.com/blog/traditional-rag-vs-agentic-rag-why-ai-agents-need-dynamic-knowledge-to-get-smarter/
- NVIDIA AI Blueprints, RAG reference implementation — https://github.com/NVIDIA-AI-Blueprints/rag
- Cohere, "Rerank" — https://cohere.com/rerank
- Cohere Docs, "Command A" — https://docs.cohere.com/docs/command-a
- BAAI, "BGE Reranker v2-m3" — https://huggingface.co/BAAI/bge-reranker-v2-m3
- Khattab and Zaharia, "ColBERT" (arXiv:2004.12832) — https://arxiv.org/abs/2004.12832
- OpenAI, "New Tools for Building Agents" — https://openai.com/index/new-tools-for-building-agents/
- OpenAI, "New tools and features in the Responses API" — https://openai.com/index/new-tools-and-features-in-the-responses-api/
- OpenAI Developers, "Responses API tool orchestration" — https://developers.openai.com/cookbook/examples/responses_api/responses_api_tool_orchestration
- OpenAI Platform Docs, "Deep Research Guide" — https://platform.openai.com/docs/guides/deep-research
- Andreessen Horowitz, "Big Ideas 2026 (Part 1)" — https://a16z.com/newsletter/big-ideas-2026-part-1/
- Andreessen Horowitz, "The Rise of Computer Use and Agentic Coworkers" — https://a16z.com/the-rise-of-computer-use-and-agentic-coworkers/
- Andreessen Horowitz, "Vector Databases and the Power of RAG" — https://a16z.com/podcast/vector-databases-and-the-power-of-rag/
- Andreessen Horowitz, "Investing in Hebbia" — https://a16z.com/announcement/investing-in-hebbia/
- Sequoia Capital, "2026: This is AGI" — https://sequoiacap.com/article/2026-this-is-agi/
- Sequoia Capital, "AI in 2026: A Tale of Two AIs" — https://sequoiacap.com/article/ai-in-2026-the-tale-of-two-ais/
- Sequoia Capital Podcast, "Context Engineering Our Way to Long-Horizon Agents" (Harrison Chase) — https://sequoiacap.com/podcast/context-engineering-our-way-to-long-horizon-agents-langchains-harrison-chase/
- Sequoia Capital, "LangChain: From Agent 0 to 1 to Agentic Engineering" — https://sequoiacap.com/article/langchain-from-agent-0-to-1-to-agentic-engineering/
- Bessemer Venture Partners, "AI Infrastructure Roadmap: Five frontiers for 2026" — https://www.bvp.com/atlas/ai-infrastructure-roadmap-five-frontiers-for-2026
- Bessemer Venture Partners, "Securing AI Agents" — https://www.bvp.com/atlas/securing-ai-agents-the-defining-cybersecurity-challenge-of-2026
- Gartner Press Release, "40% of enterprise apps will feature task-specific AI agents by 2026" — https://www.gartner.com/en/newsroom/press-releases/2025-08-26-gartner-predicts-40-percent-of-enterprise-apps-will-feature-task-specific-ai-agents-by-2026-up-from-less-than-5-percent-in-2025
- Gartner Press Release, "Over 40% of Agentic AI projects will be canceled by end of 2027" — https://www.gartner.com/en/newsroom/press-releases/2025-06-25-gartner-predicts-over-40-percent-of-agentic-ai-projects-will-be-canceled-by-end-of-2027
- Gartner, SCM Software with Agentic AI $53B forecast — https://www.gartner.com/en/newsroom/press-releases/2026-04-07-gartner-forecasts-supply-chain-management-software-with-agentic-ai-will-grow-to-53-billion-in-spend-by-2030
- McKinsey, "State of AI trust in 2026: Shifting to the agentic era" — https://www.mckinsey.com/capabilities/tech-and-ai/our-insights/tech-forward/state-of-ai-trust-in-2026-shifting-to-the-agentic-era
- McKinsey, "Seizing the Agentic AI Advantage" — https://www.mckinsey.com/capabilities/quantumblack/our-insights/seizing-the-agentic-ai-advantage
- McKinsey, "The State of AI 2025: Agents, Innovation" — https://www.mckinsey.com/~/media/mckinsey/business%20functions/quantumblack/our%20insights/the%20state%20of%20ai/november%202025/the-state-of-ai-2025-agents-innovation_cmyk-v1.pdf
- MarketsandMarkets, RAG Market Report — https://www.marketsandmarkets.com/PressReleases/retrieval-augmented-generation-rag.asp
- MarketsandMarkets, Vector Database Market — https://www.marketsandmarkets.com/Market-Reports/vector-database-market-112683895.html
- Grand View Research, RAG Market — https://www.grandviewresearch.com/industry-analysis/retrieval-augmented-generation-rag-market-report
- Fortune Business Insights, Agentic AI Market — https://www.fortunebusinessinsights.com/agentic-ai-market-114233
- LangChain Blog, "Series B Announcement" — https://blog.langchain.com/series-b/
- TechCrunch, "Open-source agentic startup LangChain hits $1.25B valuation" — https://techcrunch.com/2025/10/21/open-source-agentic-startup-langchain-hits-1-25b-valuation/
- Fortune, "Early AI darling LangChain is now a unicorn" — https://fortune.com/2025/10/20/exclusive-early-ai-darling-langchain-is-now-a-unicorn-with-a-fresh-125-million-in-funding/
- LangChain Blog, "Your harness, your memory" — https://www.langchain.com/blog/your-harness-your-memory
- LangChain Blog, NVIDIA enterprise partnership — https://blog.langchain.com/nvidia-enterprise/
- LangChain Newsletter, March 2026 — https://www.langchain.com/blog/march-2026-langchain-newsletter
- TechCrunch, "LlamaIndex launches a cloud service for building unstructured data agents" — https://techcrunch.com/2025/03/04/llamaindex-launches-a-cloud-service-for-building-unstructed-data-agents/
- LlamaIndex Blog, "Series A and LlamaCloud GA" — https://www.llamaindex.ai/blog/announcing-our-series-a-and-llamacloud-general-availability
- LlamaIndex Blog, "LlamaIndex is more than a RAG framework" — https://www.llamaindex.ai/blog/llamaindex-is-more-than-a-rag-framework
- PRNewswire, "LlamaIndex Secures $19 Million Series A" — https://www.prnewswire.com/news-releases/llamaindex-secures-19-million-series-a-to-power-enterprise-grade-knowledge-agents-302390936.html
- Norwest Venture Partners, "LlamaIndex" — https://www.norwest.com/blog/llamaindex-harnesses-the-power-of-enterprise-data-for-ai-agent-workflows/
- Pulse2, "CrewAI Multi-Agent Platform Raises $18M Series A" — https://pulse2.com/crewai-multi-agent-platform-raises-18-million-series-a/
- Insight Partners, "CrewAI ScaleUp AI story" — https://www.insightpartners.com/ideas/crewai-scaleup-ai-story/
- Enterprise AI World, CrewAI $18M — https://www.enterpriseaiworld.com/Articles/News/News/$18M-in-Funding-Catapults-CrewAIs-Multi-Agentic-Platform-to-the-Enterprise-Level-166495.aspx
- deepset, "Funding Announcement Balderton Capital" — https://www.deepset.ai/news/funding-announcement-balderton-capital
- deepset, "Introducing Haystack Enterprise Platform" — https://www.deepset.ai/blog/introducing-haystack-enterprise-platform
- Visual Studio Magazine, "Microsoft ships production-ready Agent Framework 1.0" — https://visualstudiomagazine.com/articles/2026/04/06/microsoft-ships-production-ready-agent-framework-1-0-for-net-and-python.aspx
- Microsoft Learn, "Agent Framework Overview" — https://learn.microsoft.com/en-us/agent-framework/overview/
- Visual Studio Magazine, "Semantic Kernel + AutoGen open source Microsoft Agent Framework" — https://visualstudiomagazine.com/articles/2025/10/01/semantic-kernel-autogen--open-source-microsoft-agent-framework.aspx
- Dify — https://dify.ai/
- Pinecone Blog, "Series B" — https://www.pinecone.io/blog/series-b/
- TechCrunch, "Pinecone drops $100M investment on $750M valuation" — https://techcrunch.com/2023/04/27/pinecone-drops-100m-investment-on-750m-valuation-as-vector-database-demand-grows/
- VentureBeat, "Pinecone founder Edo Liberty appoints Googler Ash as CEO" — https://venturebeat.com/data-infrastructure/pinecone-founder-edo-liberty-appoints-googler-ash-as-ceo
- PRNewswire, Pinecone CEO transition — https://www.prnewswire.com/news-releases/pinecone-founder-edo-liberty-to-spearhead-pinecones-growing-ai-ambitions-appoints-ash-ashutosh-as-ceo-to-expand-vector-database-market-leadership-302549334.html
- Calcalist Tech, Pinecone sale speculation — https://www.calcalistech.com/ctechnews/article/rz31q82b5
- TechTarget SearchDataManagement, Pinecone eyes future — https://www.techtarget.com/searchdatamanagement/news/366631366/Vector-database-vendor-Pinecone-eyes-future-under-new-CEO
- Pinecone Blog, "Pinecone Assistant Generally Available" — https://www.pinecone.io/blog/pinecone-assistant-generally-available/
- Weaviate, "Weaviate Series B" — https://www.prnewswire.com/news-releases/weaviate-raises-50-million-series-b-funding-to-meet-soaring-demand-for-ai-native-vector-database-technology-301803296.html
- Weaviate, Weaviate Goes Full Stack — https://www.globenewswire.com/news-release/2025/03/04/3036570/0/en/Weaviate-Goes-Full-Stack-With-Launch-of-Weaviate-Agents-for-AI-Development.html
- Weaviate Blog, Query Agent — https://weaviate.io/blog/query-agent
- Weaviate Blog, 2025 year in review — https://weaviate.io/blog/weaviate-in-2025
- Weaviate, Agent Skills launch — https://www.globenewswire.com/news-release/2026/02/21/3242244/0/en/Weaviate-Launches-Agent-Skills-to-Empower-AI-Coding-Agents.html
- Weaviate, GigaOm Leader / Gartner Emerging Leader recognition — https://www.globenewswire.com/news-release/2026/01/14/3218396/0/en/Weaviate-named-a-Leader-and-Outperformer-by-GigaOm-and-Emerging-Leader-by-Gartner-Market-Momentum-Accelerates-as-Nonrelational-DBMS-Segment-Grows-22-7.html
- TechCrunch, "Qdrant open-source vector database" — https://techcrunch.com/2024/01/23/qdrant-open-source-vector-database/
- Qdrant Blog, "Series A funding round" — https://qdrant.tech/blog/series-a-funding-round/
- BusinessWire, "Qdrant Raises $50M Series B" — https://www.businesswire.com/news/home/20260312313902/en/Qdrant-Raises-$50-Million-Series-B-to-Define-Composable-Vector-Search-as-Core-Infrastructure-for-Production-AI
- Chroma Company, "Seed" — https://www.trychroma.com/company/seed
- Medium, "Our investment in Chroma (Astasia Myers)" — https://medium.com/memory-leak/our-investment-in-chroma-the-developer-centric-embedding-database-34277ac327e8
- Salestools, Chroma Series B report — https://salestools.io/en/report/chroma-raises-18m-series-b
- TechCrunch, "Zilliz relocates to SF, raises $60M" — https://techcrunch.com/2022/08/24/zilliz-the-startup-behind-the-milvus-open-source-vector-database-for-ai-applications-raises-60m-and-relocates-to-sf/
- Yahoo Finance, "Milvus surpasses 40,000 GitHub stars" — https://finance.yahoo.com/news/milvus-surpasses-40-000-github-010000562.html
- TechCrunch, Vespa spin-out — https://techcrunch.com/2023/10/04/yahoo-spins-out-vespa-its-search-tech-into-an-independent-company/
- Vespa.ai, Blossom Capital funding — https://vespa.ai/2023-11-01-blossom-funding/
- Tracxn, LanceDB profile — https://tracxn.com/d/companies/lancedb/__ie1HuEEUoPOIc3tEX5yowY9yMJz9kdNTH01mwCePxLw
- BetaKit, Turbopuffer raises financing — https://betakit.com/ex-shopify-engineers-raise-fresh-financing-to-scale-turbopuffers-ai-search/
- Turbopuffer, About — https://turbopuffer.com/about
- SiliconANGLE, Contextual AI nabs $80M for RAG 2.0 — https://siliconangle.com/2024/08/02/contextual-ai-nabs-80m-rag-2-0-platform/
- Contextual AI Blog, Platform GA — https://contextual.ai/blog/platform-ga-press-release
- Contextual AI Research, Introducing RAG 2.0 — https://contextual.ai/research/introducing-rag2
- VentureBeat, Contextual AI outperforms GPT-4o — https://venturebeat.com/ai/contextual-ais-new-ai-model-crushes-gpt-4o-in-accuracy-heres-why-it-matters
- VentureBeat, Contextual AI Agent Composer — https://venturebeat.com/technology/contextual-ai-launches-agent-composer-to-turn-enterprise-rag-into-production
- Morningstar PRNewswire, Agent Composer launch — https://www.morningstar.com/news/pr-newswire/20260127sf71236/contextual-ai-launches-agent-composerai-for-when-it-actually-is-rocket-science
- TechCrunch, "Cohere hits $7B valuation partners with AMD" — https://techcrunch.com/2025/09/24/cohere-hits-7b-valuation-a-month-after-its-last-raise-partners-with-amd/
- PSP Investments / Cohere funding announcement — https://www.investpsp.com/en/news/fresh-funding-enables-cohere-to-accelerate-its-global-expansion-and-build-the-next-generation-of-secure-enterprise-and-sovereign-ai-solutions/
- Futurum Group, "Cohere multilingual sovereign AI moat" — https://futurumgroup.com/insights/coheres-multilingual-sovereign-ai-moat-ahead-of-a-2026-ipo/
- InfoWorld, "Cohere goes North with agentic AI" — https://www.infoworld.com/article/3757962/cohere-goes-north-with-agentic-ai.html
- Vectara Series A, BusinessWire — https://www.businesswire.com/news/home/20240716489550/en/Vectara-Secures-%2425-Million-Series-A-Funding-to-Advance-the-Trustworthiness-of-Retrieval-Augmented-Generation-with-New-Mockingbird-LLM
- Glean, Series F $150M — https://www.glean.com/press/glean-raises-150m-series-f-at-7-2b-valuation-to-accelerate-enterprise-ai-agent-innovation-globally
- TechCrunch, Glean $7.2B valuation — https://techcrunch.com/2025/06/10/enterprise-ai-startup-glean-lands-a-7-2b-valuation/
- CNBC, Glean $150M Series F — https://www.cnbc.com/2025/06/10/glean-gen-ai-search-startup-raises-150-million-at-7-billion-value.html
- TechCrunch, Perplexity $200M at $20B — https://techcrunch.com/2025/09/10/perplexity-reportedly-raised-200m-at-20b-valuation/
- Writer.com, Series C announcement — https://writer.com/blog/series-c-funding-writer-press-release/
- TechCrunch, Writer $200M at $1.9B — https://techcrunch.com/2024/11/12/generative-ai-startup-writer-raises-200m-at-a-1-9b-valuation/
- TechCrunch, Hebbia $130M Series B — https://techcrunch.com/2024/07/09/ai-startup-hebbia-rased-130m-at-a-700m-valuation-on-13-million-of-profitable-revenue/
- Hebbia Blog, Series B — https://www.hebbia.com/blog/hebbia-raises-usd130m-series-b
- TechCrunch, Harvey $11B valuation — https://techcrunch.com/2026/03/25/harvey-confirms-11b-valuation-sequoia-triples-down/
- CNBC, Harvey $200M at $11B — https://www.cnbc.com/2026/03/25/legal-ai-startup-harvey-raises-200-million-at-11-billion-valuation.html
- Harvey, Series announcement — https://www.harvey.ai/blog/harvey-raises-at-dollar11-billion-valuation-to-scale-agents-across-law-firms-and-enterprises
- TechCrunch, Harvey $8B December 2025 — https://techcrunch.com/2025/12/04/legal-ai-startup-harvey-confirms-8b-valuation/
- TechCrunch, Bret Taylor Sierra $350M at $10B — https://techcrunch.com/2025/09/04/bret-taylors-sierra-raises-350m-at-a-10b-valuation/
- TechCrunch, Sierra $100M ARR — https://techcrunch.com/2025/11/21/bret-taylors-sierra-reaches-100m-arr-in-under-two-years/
- CNBC, Sierra $10B valuation — https://www.cnbc.com/2025/09/04/bret-taylor-sierra-ai-startup-salesforce-openai.html
- Decagon Blog, Series D announcement — https://decagon.ai/blog/series-d-announcement
- Bloomberg, Decagon $4.5B valuation — https://www.bloomberg.com/news/articles/2026-01-28/ai-customer-support-startup-decagon-valued-at-4-5-billion
- Decagon Blog, Series C — https://decagon.ai/resources/series-c-announcement
- BusinessWire, Decagon Series D — https://www.businesswire.com/news/home/20260128580542/en/Decagons-Valuation-Triples-to-$4.5-Billion-as-it-Ushers-in-the-Age-of-AI-Concierge
- Sana Labs, Series B announcement — https://sanalabs.com/resources/announcing-sanas-series-b-round
- Sana Labs, Series B extension — https://sanalabs.com/resources/sana-reaches-62m-dollars-in-series-b-funding
- You.com, Series C announcement — https://you.com/resources/series-c
- TechStartups, You.com $1.5B valuation — https://techstartups.com/2025/09/04/you-com-raises-100m-series-c-in-funding-at-1-5b-valuation-to-scale-ai-search-infrastructure/
- TechCrunch, Databricks $4B at $134B — https://techcrunch.com/2025/12/16/databricks-raises-4b-at-134b-valuation-as-its-ai-business-heats-up/
- Databricks, MosaicML acquisition — https://www.databricks.com/company/newsroom/press-releases/databricks-completes-acquisition-mosaicml
- Databricks Blog, Genie Code — https://www.databricks.com/blog/introducing-genie-code
- Databricks, Agent Bricks launch — https://www.databricks.com/company/newsroom/press-releases/databricks-launches-agent-bricks-new-approach-building-ai-agents
- TechCrunch, Matei Zaharia wins ACM Computing Prize — https://techcrunch.com/2026/04/08/databricks-matei-zaharia-wins-acm-computing-prize-agi/
- TechCrunch, Sequoia raises $7B for AI — https://techcrunch.com/2026/04/16/new-leaders-new-fund-sequoia-has-raised-7b-to-expand-its-ai-bets/
- Snowflake Release Notes, Cortex Agents GA — https://docs.snowflake.com/en/release-notes/2025/other/2025-11-04-cortex-agents
- Snowflake, Cortex overview — https://www.snowflake.com/en/product/features/cortex/
- Snowflake, Cortex Code — https://www.snowflake.com/en/product/features/cortex-code/
- SaaStr, "The 2025 SaaS Vibe Check with Jason Lemkin" — https://www.saastr.com/the-2025-saas-vibe-check-what-founders-need-to-know-right-now-with-saastr-ceo-and-founder-jason-lemkin/
- Jahanzaib.ai, "Agentic RAG Production Guide" — https://www.jahanzaib.ai/blog/agentic-rag-production-guide
- Suprmind, "AI Hallucination Rates and Benchmarks" — https://suprmind.ai/hub/ai-hallucination-rates-and-benchmarks/
