深度解析：已成为RAG主流的"Agentic RAG（智能体型RAG）"

从2025年到2026年，硅谷AI基础设施领域中"RAG（检索增强生成）"一词的含义被悄然而决定性地重新定义。2020年由Meta的Douwe Kiela等人提出的经典RAG——将查询向量化，检索排名前k个文本块，直接注入LLM的单次流水线——到2024年已在企业落地中遭遇严重瓶颈。[McKinsey](https://newsify.tv/services/mckinsey)于2026年1月发布的《2026年AI信任现状》报告指出，2024年将RAG投入生产环境的企业AI团队中，有58%在半年内将"跨异构数据源的多步推理"列为最大制约因素。正是为了填补这一缺口，2025年将自主智能体嵌入检索循环的"Agentic RAG"得以主流化。[Andreessen Horowitz](https://newsify.tv/investors/andreessen-horowitz)、[Sequoia Capital](https://newsify.tv/investors/sequoia-capital)、[Bessemer Venture Partners](https://newsify.tv/investors/bessemer-venture-partners)、[Benchmark](https://newsify.tv/investors/benchmark)、[Accel](https://newsify.tv/investors/accel)、[Greylock](https://newsify.tv/investors/greylock-partners)、[Kleiner Perkins](https://newsify.tv/investors/kleiner-perkins)、[Coatue](https://newsify.tv/investors/coatue)、[Index Ventures](https://newsify.tv/investors/index-ventures)等主要风险投资机构在过去一年间，向[LangChain](https://newsify.tv/services/langchain)、[LlamaIndex](https://newsify.tv/services/llamaindex)、[Pinecone](https://newsify.tv/services/pinecone)、Contextual AI、[Cohere](https://newsify.tv/services/cohere)、Hebbia、Harvey、Sierra、Decagon、[Glean](https://newsify.tv/services/glean)等企业累计注入了数百亿美元规模的资本。本文将从硅谷工程师视角出发，对Agentic RAG的生态环境、各服务与产品的内部架构、风险投资机构的研判，以及2026年下半年至2027年间可预见的动向，进行系统性的一体化解读。 ---

第1章　为何当今的RAG不得不走向"Agentic"

Douwe Kiela等人在Facebook AI Research时期于2020年向arXiv投稿的论文《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》，是当今"RAG"一词的起源。该论文所提出的流程后来被称为"Naive RAG"——将查询转换为Embedding，在向量空间中检索最近邻的k个片段，并将其作为上下文插入LLM，是一种简单的管道设计。2022年末ChatGPT问世后，这种Naive RAG以Bugatti级的速度得到普及，但从2023年到2024年，企业级实施现场暴露出三堵墙。

第一，试图用单一Embedding空间表达所有查询的设计，对于意图混杂的长查询或需要多步推理的问题，在结构上存在天然缺陷。第二，向量检索擅长返回"语义上相似"的文档，却无法保证返回"对查询而言事实正确"的文档。第三，企业数据不仅限于非结构化文档，还分散在SQL表、知识图谱、API、实时事件等各处，将所有数据塞入单一向量数据库的方案本身就不切实际。

学术界在2023年至2024年间，连续涌现出一批突破这些局限的论文。Asai等人提出的Self-RAG（arXiv:2310.11511，2023年10月）引入了reflection token机制，让LLM自身判断"是否需要检索"以及"检索结果是否合理"，为模型动态决定是否检索开辟了道路。Yan等人于2024年1月发表的CRAG（Corrective RAG，arXiv:2401.15884）展示了一种设计：轻量级检索评估器返回置信度分数，当置信度较低时触发Web搜索作为外部扩展。Jeong等人于2024年3月发表的Adaptive-RAG（arXiv:2403.14403，NAACL 2024录用）提出了三级路由架构——在前端放置一个对查询复杂度进行分类的小型语言模型，简单查询无需检索，中等查询进行单次检索，复杂查询则进行迭代检索。这些论文都建立在ReAct模式（Yao et al.，arXiv:2210.03629，ICLR 2023）这一"交错推理与行动"的基本设计之上，并在2025年初实际上形成了行业标准。

2025年1月，Singh、Ehtesham、Kumar、Khoei、Vasilakos等人将这一脉络系统化为《A Survey of Agentic Retrieval-Augmented Generation for Large Language Models》（arXiv:2501.09136），将RAG的演进整理为"Naive RAG → Advanced RAG → Modular RAG → Agentic RAG"四个世代。该论文将其定义为："Agentic RAG通过嵌入反思（reflection）、规划（planning）、工具使用（tool use）、多智能体协作等设计模式，动态管理检索策略，迭代精炼上下文理解。"

从硅谷工程师的视角总结这一变化：Naive RAG是"函数调用"，而Agentic RAG是"进程执行"。前者是从查询到答案的单向管道，后者则拥有状态与循环，在必要时执行重试、路由和工具调用，更接近操作系统进程的存在。Anthropic于2025年6月公开的工程博客《How we built our multi-agent research system》报告称，以Claude Opus 4为领导者、Claude Sonnet 4为子智能体的编排-工作者型架构，在内部评估中比单一智能体Claude Opus 4高出90.2%，定量展示了多智能体架构的优越性。与此同时，博客也坦率指出："多智能体消耗的token约为标准对话的15倍"，"token使用量解释了浏览评估中80%的性能方差"，这一性能是以成本为代价才能获得的。

市场数据同样印证了这一转变。Gartner在2025年8月26日的新闻稿中预测，2025年时不足5%的任务型AI智能体应用占比，将在2026年底跃升至40%。预测还显示，到2028年，33%的企业软件将内嵌智能体型AI，70%的AI应用将采用多智能体方式。据MarketsandMarketsReport，仅RAG市场本身就将从2025年的19.4亿美元（约2910亿日元）扩张至2030年的98.6亿美元（约1兆4790亿日元），CAGR为38.4%；Grand View Research估算CAGR为49.1%，2030年将达110亿美元（约1兆6500亿日元）。向量数据库市场方面，MarketsandMarkets预测将从2025年的26.5亿美元（约3975亿日元）增长至2030年的89.5亿美元（约1兆3425亿日元），CAGR为27.5%；Fortune Business Insights则预测智能体型AI整体市场规模将从2026年的91.4亿美元（约1兆3710亿日元）爆炸性增长至2034年的1391.9亿美元（约20兆8785亿日元），CAGR高达40.5%。这些数字将Agentic RAG从"少数AI实验室的实验"推上了"数万亿日元规模基础设施市场"的舞台。

第2章　Agentic RAG的核心技术与设计模式

如果工程师用一句话定义 Agentic RAG，那便是："一个以检索作为工具调用的循环系统，在每次循环中更新状态与决策。"这一定义中，至少蕴含着六个相互独立的技术要素。

第一个要素是查询路由（query routing）、查询改写（rewriting）、查询分解（decomposition）以及 HyDE（假设文档嵌入，Hypothetical Document Embedding）。路由是指：接收到用户查询的智能体，需要判断应将其发送至向量数据库、转换为 SQL 查询、交由 Web 搜索处理，还是翻译为知识图谱的 Cypher 查询。改写是将用户口语化的表达转换为适合检索的标准形式，通常使用小型 LLM 来完成。分解是将"A 与 B 有何不同，C 又与之如何关联"这类复合问题拆分为多个子查询的过程。HyDE 是 Gao 等人（2022）提出的方法，其思路是让 LLM 针对用户查询生成一个假想回答，再对该假想回答进行嵌入并用于检索，从而缩小查询与文档之间的风格差距。

第二个要素是混合检索（hybrid search）。2025 年至 2026 年间，业界逐渐形成共识，收敛于"dense（密集向量）＋ sparse（BM25 / SPLADE）＋重排序"的三层结构。dense 捕捉语义相似性，sparse 捕捉词汇匹配性，两者相互弥补各自的不足。NVIDIA 在 GitHub 上公开的 RAG Blueprint 参考实现，支持以可插拔方式在 ElasticSearch 与 Milvus 之间切换，提供 dense+sparse 混合检索、多集合检索、GPU 加速索引与查询，并以 RRF（Reciprocal Rank Fusion）作为标准融合方案。Anthropic 于 2024 年 9 月发布的《Contextual Retrieval》在嵌入分块之前，使用 Claude 添加上下文说明前缀，实验结果令人瞩目：相较于简单嵌入，Top-20 检索失败率降低了 35%；结合 BM25 后降低 49%；结合重排序后降低 67%，一举重写了 RAG 索引前处理的实现标准。

第三个要素是重排序（reranking）。对 dense 检索与 sparse 检索所得的候选集，再施以计算成本更高的交叉编码器进行排序调整。Cohere 于 2024 年 9 月发布的 Rerank 3 支持 4K 上下文长度，该公司声称："Rerank 仅将最相关的文档传入 RAG 流水线与智能体工作流，从而减少 token 消耗、降低延迟、提升精度。"BAAI 于 2024 年 3 月发布的 BGE Reranker v2 系列（v2-m3、v2-gemma、v2-minicpm-layerwise）已成为开源阵营的标准。Omar Khattab 等人提出的 ColBERT / ColBERTv2 采用"后期交互（late interaction）"的不同路径，以低两个数量级的 FLOPs 和高两个数量级的吞吐量达到 BERT 级别的效果，ColBERTv2 还将存储占用压缩了 6 至 10 倍。

第四个要素是自我反思（self-reflection）与自我修正。Self-RAG 的反思 token 机制和 CRAG 的置信度评分，均属于这一脉络。在实现层面，LangGraph 提供的条件边（conditional edge）模式是典型方案：通过插入判断"检索结果是否充分"、"生成结果是否与事实一致"的节点，动态驱动检索循环。基于 LangGraph 的 Adaptive RAG 将选择性路由与验证相结合，据多项实现基准报告，相较于静态 RAG，可将幻觉减少多达 78%。

第五个要素是图 RAG（GraphRAG）。Microsoft Research 的 Edge 等人在 arXiv:2404.16130 中公开了 GraphRAG，并于 2025 年 2 月发布 v2。GraphRAG 使用 LLM 从文档集合中构建实体知识图谱，并预先计算社区检测与社区摘要，形成两阶段索引。这使得在百万 token 规模语料库上的"全局语义理解"（global sensemaking）型查询——即针对整体趋势或全面摘要的查询——在覆盖性与多样性两个维度上均大幅超越纯向量 RAG。此外，2024 年 11 月发布的 LazyGraphRAG 将索引成本降低至与向量 RAG 相当（仅为完整 GraphRAG 的 0.1%），查询时成本为 GraphRAG Global Search 的 1/700，同时保持同等的回答质量，并以 4% 的查询成本在全局与局部两类查询中均超越 GraphRAG，实现了成本与质量的兼顾。LazyGraphRAG 已于 2025 年内集成至 Microsoft Discovery 与 Azure Local，在产品层面正式投入实战。

第六个要素是长期记忆与状态管理。Harrison Chase 于 2026 年 4 月发表的论文《Your harness, your memory》明确提出：应将智能体的短期记忆（会话内消息及较大的工具调用结果）与长期记忆（跨会话记忆）加以分离，并将记忆管理职责集中至智能体框架（harness）一侧。他在 LangChain Deep Agents 中实现了"基于文件系统的工作记忆"、"渐进式技能披露"与"分层安全"，并强调"选择闭源方案意味着失去对自己数据的控制权"，力主记忆层的开源化。这与 OpenAI 在 Responses API（2025 年 3 月发布）中将托管工具原语（file_search、web_search、function calling）内化的策略形成鲜明对立，构成一个思想分歧的节点，也成为 2026 年智能体 AI 讨论的核心议题。

在 2026 年的生产环境中，整合上述六个要素的实现成本绝非轻松。独立顾问 Jahanzaib 于 2026 年初发布的生产指南显示：标准检索的每次查询单价为 0.06 至 0.09 美元（约 9 至 14 日元），而复杂的多跳 Agentic RAG 则可飙升至 0.18 至 0.31 美元（约 27 至 47 日元）。中等规模部署中，向量存储的月费约为 50 至 200 美元（约 7500 至 3 万日元），整体月费约为 2200 至 3400 美元（约 33 万至 51 万日元），P95 延迟的目标是控制在 2.5 秒以内。加入检索验证后，每次查询的延迟会增加 2 至 3 秒，但事实一致性有所提升。结合语义缓存，高重复负载下可降低 20 至 35% 的成本；结合智能路由，混合负载的成本可降低 30 至 45%，延迟可降低 25 至 40%——这是当前业界的普遍认知。

第3章　框架／编排层 —— LangChain、LlamaIndex、CrewAI，以及微软

Agentic RAG应用层实现框架的竞争，于2025年秋迎来了一个关键节点。LangChain于2025年10月20至21日完成了由IVP领投的B轮融资，融资额达1.25亿美元，以12.5亿美元的投后估值正式跻身独角兽行列。参与方包括CapitalG、Sapphire Ventures，战略投资方有ServiceNow Ventures、Workday Ventures、Cisco Investments、Datadog Ventures、Databricks Ventures，老股东Sequoia、Benchmark、Amplify亦跟进追加投资。正如Harrison Chase在Sequoia Capital播客《Context Engineering Our Way to Long-Horizon Agents》中所述："从三年前的简单RAG链，到基于LangGraph的复杂流程，再到Agent Harness，最优实现方式已经发生了翻天覆地的变化。"为应对这一趋势，LangChain构建了三层产品矩阵——LangChain（基础框架）、LangGraph（图式编排）和LangSmith（观测与评估），并在本轮B轮融资的同时正式发布了LangChain＋LangGraph 1.0。据《财富》杂志报道，LangChain公关方面表示，当前ARR"实际低于12至16百万美元这一区间，与我们目前的体量并不相符"，这暗示其真实增长速度正在加速至与IVP所定12.5亿美元估值相匹配的水平。Cisco、Replit、Clay、Cloudflare、Workday、ServiceNow等现有客户名单的出现，也印证了观测与评估付费层正有效地成为企业采购的切入点。

LlamaIndex于2025年3月4日完成了由Norwest Venture Partners领投的A轮融资，金额为1900万美元（Greylock参与，累计融资额2750万美元），同时LlamaCloud正式GA上线。创始人Jerry Liu在CEO博客中宣称："LlamaIndex已不再只是一个RAG框架，而是成为了Agentic Document Processing（智能体文档处理）的基础设施。"公司将业务定位从大而全的抽象框架收窄至"长期可用的最佳文档基础设施"。LlamaCloud已集成LlamaParse（文档解析）、AgentWorkflow（面向非结构化数据的多智能体知识协作）等功能，超过90家Fortune 500企业在内的逾万家机构已进入候补名单。GitHub Stars 47K、月下载量520万（2026年3月数据）的成绩，证明了聚焦文档处理的差异化定位与框架领域头部选手LangChain形成了有效共存。Jerry Liu在2026年初的Newsletter中观察到："编程智能体（Claude Code、Cursor）正以文件系统为核心向内收敛，智能体仅需5至10个核心工具加上文件系统访问即可运行"，这一判断暗示了类Agent Composer轻量工具集设计方向的未来走势。

专注多智能体角色分工的CrewAI于2024年10月完成了由Insight Partners和boldstart ventures领投的1800万美元融资。据Latka于2025年7月确认，其ARR为320万美元，但平台上过去12个月内执行的智能体任务数已突破20亿次，并公开披露Fortune 500中超过60%的企业为其客户。产品架构采用基于角色、目标与任务的智能体协作框架，即将"营销研究员""分析师""写作者"等角色按人类组织方式分配并协同工作，抽象层次高于LangGraph，实现代码更为简洁。公司已将企业云版本正式GA上线，并着重强调跨AWS/GCP/Azure多云部署能力及LLM供应商无关性。

由德国deepset主导的开源框架Haystack，最新一轮主要融资为2023年8月由Balderton Capital领投的3000万美元B轮，2025年12月将产品线重品牌为Haystack Enterprise Platform。产品具备可视化流水线编辑器、模板及私有化部署能力，维护着以Airbus、The Economist、NVIDIA、Comcast为代表的偏欧洲风格大型企业客户群，并在制造业和国防行业中确立了满足本地部署需求的优选地位。

微软将AutoGen与Semantic Kernel整合，于2026年4月正式发布Microsoft Agent Framework 1.0生产版本（2025年10月进入公开预览，翌年4月正式发布）。该框架融合了AutoGen的智能体抽象与Semantic Kernel的企业级能力（会话状态、类型安全、中间件、遥测），具备基于图的工作流编排、多供应商模型支持，以及A2A与MCP跨运行时互操作性。AutoGen此后仅进行维护性更新，新用户将被引导迁移至Agent Framework。微软的整合实质上成为Azure企业用户的事实标准Harness，并与LangChain的商业模式形成了正面竞争。

2025年，开源工作流构建器领域相继发生多起大规模整合。来自中国的Dify在HSG（高瓴）领投下完成3000万美元Pre-A轮融资，以超过13.1万GitHub Stars、包含马士基和诺华在内的280家企业客户，成为该赛道最后一个独立玩家。与此同时，Flowise于2025年8月被Workday收购，Langflow也于同年早些时候被DataStax（现为IBM旗下）收购。a16z和Sequoia反复指出的"品类赢家面临被收购风险阶段"的典型演进，已在工作流构建器层面成为现实。

第4章　向量数据库／检索基础层 —— Pinecone、Weaviate、Qdrant、Chroma、Turbopuffer

要使Agentic RAG真正高效运转，向量搜索的底层架构也需要经历重大演进。2025年至2026年间，这一领域的动向已成为硅谷最重要的基础设施投资主题之一。

Pinecone作为事实上的品类王者，于2023年4月以7.5亿美元（约合人民币54亿元）的估值完成了由a16z领投的1亿美元融资，一度处于巅峰地位，但随后在开源项目和超大规模云厂商的追赶下，于2025年发生了重大变化。创始人Edo Liberty于2025年9月从CEO职位退任，转任首席科学家，专注于"面向下一代智能体型AI系统的研究"。接任CEO一职的是曾任Google全球销售总监、并在AppDynamics和Actifio担任高管的Ash Ashutosh。Liberty常挂在嘴边的一句话是："未来五年，向量数据库将从一种技术工具转变为企业的长期记忆。"他们正在瞄准智能体长期记忆提供商这一新定位。2025年10月，The Information报道称Pinecone正联合投行探讨出售事宜，预期估价超过20亿美元，潜在买家包括Oracle、IBM、MongoDB和Snowflake。Latka的数据显示，截至2025年12月，Pinecone的营收约为1400万美元，客户数量约4000家，相对于C轮融资时的估值，ARR倍数明显增长乏力。产品层面，Pinecone推出了面向智能体构建的API产品Pinecone Assistant，推进了无服务器架构的改造，同时也开始提供MCP服务器。

Weaviate自Index Ventures领投、Battery Ventures、NEA、Cortical、Zetta及ING Ventures参与的5000万美元B轮融资（2023年4月）以来，截至2026年4月尚未宣布新一轮融资，但在此期间产品侧实现了加速突破。2025年3月，Weaviate完成了Weaviate Agents的全栈发布，同年9月将Query Agent正式推向GA。Query Agent的内部架构颇为有趣——接收用户查询后，它会执行多集合路由，并在单次工具调用中完成查询扩展与分解、过滤器生成及重排序。这是一种"通过单一API提供Agentic RAG"的战略性抽象，其设计理念也使得LangGraph等外部编排器不再是必需品。2026年2月，Weaviate公开了名为Weaviate Agent Skills的开源代码库，使Claude Code、Cursor、GitHub Copilot、VS Code、Gemini CLI等编程智能体能够生成针对Weaviate优化的代码。CEO Bob van Luijt表示："向量数据库、向量嵌入服务与智能体架构的崛起，是数据管理与数据转换演进历程中的一个重要转折点。"2026年1月，Weaviate获得GigaOm"领导者+超越者"以及Gartner"新兴领导者"的双重认可。

总部位于柏林的Qdrant于2026年3月12日完成了由AVP（Advance Venture Partners）领投的5000万美元B轮融资，Bosch Ventures、Unusual Ventures、Spark Capital及42CAP参与其中，累计融资总额达约8780万美元。公司拥有Tripadvisor、HubSpot、OpenTable、Bazaarvoice、Bosch等标杆客户，下载量超2.5亿次，GitHub Star数达2.9万。基于Rust实现的高性能，以及"可组合向量搜索"的定位——支持在云端、本地或混合环境中部署——使其与欧洲保守型企业客户尤为契合。

Chroma于2025年10月14日完成由Quiet Capital的Astasia Myers主导的B轮融资，以约7500万美元的估值融资1800万美元。其设计将向量、全文、正则表达式及元数据检索统一于单一的开发者体验之中，本地优先的轻量化嵌入方式深受独立RAG开发者及智能体应用原型构建者的青睐。

Milvus/Zilliz自2022年8月完成6000万美元B-II轮融资以来，虽未再进行大规模融资，但在产品层面仍保持着最大的开源心智份额——GitHub Star突破4万，在NVIDIA、Salesforce、eBay、Airbnb、DoorDash等超过1万家企业中落地生产环境，尤其在亚洲市场具有举足轻重的影响力。

新兴阵营中，Turbopuffer的崛起尤为值得关注。该公司由前Shopify工程师Simon Helarep Eskildsen与Justin Lee联合创立，总部位于渥太华，于2025年12月19日完成了由Lachy Groom、Thrive Capital及多位天使投资人参与的种子轮融资（融资金额未披露）。公司以Anthropic、Atlassian、Cursor、Notion为客户，提供以S3/GCS/Azure Blob等对象存储为一等公民的无服务器向量数据库。其采用基于centroid优化的SPFresh索引，在超大规模场景下的每GB成本方面远超竞争对手。在硅谷语境下，"Anthropic、Cursor、Notion等一线AI基础设施需求方已率先采用"这一事实本身，就已构成最有力的行业基准。LanceDB也于2025年6月24日完成了由Theory Ventures领投的3000万美元A轮融资，确立了其在Lance列式格式之上构建"AI原生多模态数据湖仓"的市场定位。

从工程师视角俯瞰这一领域，向量数据库正在分化为三个子品类：第一类是托管无服务器型（Pinecone），目前正在寻求出售；第二类是开源优先+托管云型（Weaviate、Qdrant、Chroma、Milvus）；第三类是对象存储驱动型（Turbopuffer、LanceDB）。Pinecone寻求出售的动向，被普遍解读为整个品类正式进入"被超大规模云厂商与开源方案双向夹击"阶段的信号。

第5章　端到端/情境化系平台 —— Contextual AI、Cohere、Vectara

Contextual AI是将Agentic RAG作为"一体化设计的单一系统"而非"各独立组件的拼凑"来提供的最具代表性的企业。创始人Douwe Kiela是2020年Meta RAG论文的第一作者，同时兼任斯坦福大学讲师。Contextual AI继2023年6月完成2000万美元（约30亿日元）种子轮融资后，于2024年8月实现了由Greycroft、Bain Capital Ventures、Lightspeed及Lip-Bu Tan等领投的8000万美元（约120亿日元）A轮融资，总融资额达1亿美元（约150亿日元）。2025年1月正式GA的Contextual AI Platform基于所谓RAG 2.0的设计理念，不再将检索器、重排序器与生成模型（Grounded Language Model）分别训练后拼接，而是对三者进行端到端的联合优化训练。据VentureBeat报道，Contextual GLM在FACTS基准测试中实现了88%的事实一致性，超越Claude 3.5 Sonnet（79.4%）和GPT-4o（78.8%）。在最新的前沿RAG基准测试中录得71.2%，超过最强基线（Cohere + Claude 3.5）的66.8%。公司已获得汇丰银行、高通等财富500强客户，并于2026年1月推出了将企业级RAG转化为生产就绪智能体的Agent Composer。然而，CB Insights数据显示其年收入规模仅约1760万英镑，估值仍在1.5亿美元（约225亿日元）左右。"技术上遥遥领先，但ARR尚未跟上"——这便是Contextual AI当前的处境，下一轮融资的估值水平备受关注。

Cohere是由《Attention Is All You Need》共同作者Aidan Gomez担任CEO的加拿大多伦多企业，作为企业级LLM的先行者实现了快速增长。2025年8月完成由Radical Ventures/Inovia Capital领投的5亿美元（约750亿日元）融资，估值达68亿美元（约1万200亿日元）；同年9月追加1亿美元（约150亿日元）的第二次交割，估值进一步提升至70亿美元（约1万500亿日元），AMD、NVIDIA、Salesforce Ventures及HOOPP参与其中。总融资额超16亿美元（约2400亿日元）。2025年ARR达2亿4000万美元（约360亿日元），超额完成原定2亿美元目标；公司延揽具有IPO经验的François Chadwick出任CFO，被视为2026年IPO的有力候选。主力产品包括：拥有1110亿参数、256K上下文窗口的旗舰模型Command A（2025年3月发布，相比Command R+ 08-2024吞吐量提升150%，可在A100/H100×2张卡上运行）、专为企业推理设计的Command A Reasoning（2025年8月）、支持4K上下文且可对100余种语言进行重排序的Rerank 3.5，以及面向企业的智能体基础平台"North"。Cohere于2025年5月收购Ottogrid（前身为Cognosys），将研究型智能体功能整合至North。最大的差异化优势在于三点："主权AI"、"多语言支持"与"VPC/私有化部署"，这一组合对监管严格的金融及公共部门，以及有多语言需求的欧洲、日本企业市场极具吸引力。

Vectara在种子轮融资2850万美元（约42亿7500万日元），并于2024年7月完成由FPV Ventures与Race Capital领投、Samsung Next和Fusion Fund参与的2500万美元（约37亿5000万日元）A轮融资，总融资规模约5350万至7350万美元。公司拥有专为降低幻觉而设计的LLM Mockingbird，是一家垂直整合型RAG API提供商，专注于在受监管行业的落地应用。2025年以来未宣布新一轮融资，持续巩固其作为精简型实施平台的市场定位。

第6章　垂直专业化的Agentic RAG —— Harvey、Hebbia、Sierra、Decagon、Glean

与水平平台层并行，专注特定领域的"垂直型Agentic RAG"在2025年至2026年间吸引了最大规模的资本。追踪各公司的商业模式与融资历程，VC的投资重点一目了然。

专注法律领域的Harvey继2024年D轮融资之后，于2025年6月以50亿美元（约750亿人民币）估值完成由Kleiner Perkins与Coatue联合领投的3亿美元（约45亿人民币）E轮融资；2025年12月以80亿美元（约1200亿人民币）估值完成a16z领投的1.6亿美元（约24亿人民币）融资；2026年3月25日以110亿美元（约1650亿人民币）估值完成由GIC与Sequoia联合领投（Sequoia第三次参与）的2亿美元（约30亿人民币）融资。累计融资总额突破10亿美元（约150亿人民币）。Harvey截至2026年1月的ARR已达1.9亿美元（约28.5亿人民币），较2025年8月的1亿美元（约15亿人民币）在半年内增长1.9倍。客户覆盖AmLaw 100中的过半数律所、500余家企业内部法务团队、50家资产管理公司，业务遍及60个国家。Sequoia在2026年3月的轮次中再度印证了"Agentic AI垂直用例的可防御性"，Harvey已成为2026年垂直Agentic RAG领域最重要的标杆企业。

专注金融与法律深度工作的Hebbia，于2024年4月至7月间完成由a16z领投、Index Ventures、GV、Peter Thiel、Eric Schmidt、Jerry Yang等参与的1.3亿美元（约19.5亿人民币）B轮融资，估值达7亿美元（约105亿人民币）。彼时ARR约为1300万美元（约1.95亿人民币），对应54倍估值乘数。客户覆盖全球顶级资产管理公司的三分之一，合计管理规模达14万亿美元（约210万亿人民币）。核心产品Matrix采用电子表格网格UI，以原生方式呈现多智能体的检索、落地与核验流程，于2025年6月完成重新设计，同月收购FlowDocs以内置幻灯片生成功能（目前每日生成超1万份幻灯片）。Hebbia是最忠实践行a16z"以AI智能体替代深度工作"理论的企业。

由Bret Taylor（OpenAI董事长、前Salesforce联席CEO）与Clay Bavor（前Alphabet高管）联合创立的Sierra，继2024年10月以4.5亿美元估值完成1.75亿美元（约26.25亿人民币）融资后，于2025年9月4日以100亿美元（约1500亿人民币）估值完成由Greenoaks Capital领投的3.5亿美元（约52.5亿人民币）融资，累计融资总额达6.35亿美元（约95.25亿人民币）。ARR于2025年11月达到1亿美元（约15亿人民币），创下创业第七季度的纪录，并在成立三年内将年营收运行率推至1.5亿美元（约22.5亿人民币）。客户涵盖数百家大型企业，其中逾20%年营收超百亿美元。Sierra以客户服务为核心，其优势在于为品牌提供可将业务权限委托给智能体至"实际执行操作"层级（如退款处理、工单创建）的校验工具，而Bret Taylor品牌效应所带来的信任度，是其突出的差异化优势。

Decagon于2025年6月以15亿美元（约225亿人民币）估值完成由Accel与a16z联合领投的1.31亿美元（约19.65亿人民币）融资，仅七个月后的2026年1月28日，又以45亿美元（约675亿人民币）估值完成由Coatue与Index Ventures联合领投的2.5亿美元（约37.5亿人民币）融资。估值在半年多时间内增长三倍，其将产品重新定位为高接触客户服务AI"AI Concierge"的战略初见成效。2025年内已签约逾100家新企业客户，D轮融资参与方包括Bain Capital Ventures、BOND、Ribbit、Forerunner、Avra、A*、ChemistryVC、Definition Capital及Starwood Capital。

将企业搜索拓展至Agentic AI领域的Glean，继2024年9月完成2.6亿美元（约39亿人民币）E轮融资（估值46亿美元，约690亿人民币）后，于2025年6月10日以72亿美元（约1080亿人民币）估值完成由Wellington Management领投的1.5亿美元（约22.5亿人民币）F轮融资。新进投资方包括Khosla Ventures、Bicycle Capital、Geodesic Capital及Archerman，现有投资方Altimeter、Capital One Ventures、Citi、Coatue、DST、General Catalyst、ICONIQ、IVP、Kleiner Perkins、Latitude、Lightspeed、Sapphire及Sequoia均追加投资。Glean整合了权限感知型企业SaaS连接器、Glean Agents及工作助手，已成为Reid Hoffman所言"智能体增幅（agent amplification）"的代表案例，在硅谷核心圈层中被广泛引用。

同属垂直赛道的Writer.com于2024年11月12日以19亿美元（约285亿人民币）估值完成由Premji Invest、Radical Ventures与ICONIQ Growth联合领投的2亿美元（约30亿人民币）融资，Adobe Ventures、B Capital、Citi Ventures、IBM Ventures、Salesforce Ventures及Workday Ventures参与其中。该公司将自研大模型Palmyra系列与图谱型RAG、安全护栏及无代码智能体构建器相结合，面向医疗健康、零售及金融服务行业提供垂直化解决方案。

企业级LMS/知识管理平台Sana AI于2025年9月16日以11亿美元（约165亿人民币）被Workday收购，成为该领域2025年规模最大的智能体并购案例。同样，workflow builder平台Flowwise也被Workday收购，Langflow则被DataStax（现已并入IBM）纳入麾下，垂直SaaS厂商在企业内部嵌入Agentic RAG的进程正在快速推进。

第7章　MCP与生态系统标准化 —— 为什么Anthropic将MCP捐赠给Linux基金会

在Agentic RAG的讨论中，2025年最重大的架构事件是Model Context Protocol（MCP）的行业标准化。Anthropic于2024年11月公开MCP时，它不过是一家公司的开放规范，但2025年3月OpenAI在Agents SDK、Responses API及ChatGPT desktop中宣布采用，同年4月Google DeepMind也相继跟进。截至2026年3月，Python/TypeScript SDK的月下载量已达9700万次，公开的MCP服务器超过1万个。2025年11月25日，规范进行了重大更新，涵盖async操作、无状态性、服务器标识及社区驱动注册表等内容；2025年12月，Anthropic将MCP捐赠给Linux Foundation旗下的Agentic AI Foundation（AAIF）。AAIF由Anthropic、Block、OpenAI联合创立，Google、Microsoft、AWS、Cloudflare、Bloomberg提供支持。

随着MCP的标准化，Agentic RAG的竞争轴线已从"使用哪个向量数据库"转变为"使用哪个框架/控制层"。Pinecone提供MCP服务器，Weaviate Agent Skills通过MCP与编码代理进行交互，Anthropic自身也借助MCP实现了对数千个数据源的访问，LangChain与Microsoft Agent Framework均宣称原生支持MCP。由此，数据源侧的连接器价值迅速商品化，价值重心转向编排与数据治理。Forrester预测，30%的企业应用供应商将在2026年底前发布MCP服务器。

与之形成竞争态势的是OpenAI的Responses API，其策略是将托管工具原语（file_search、web_search、function calling）收归OpenAI内部。Responses API的file_search定价为每1000次查询2.5美元，存储费用为每GB每天0.10美元，新建的向量存储最多支持1亿个文件（2025年11月扩展后从1万提升至1亿）。Assistants API将于2026年8月26日停用，功能并入Responses API。工程师面临的选择十分清晰：是加入"OpenAI/Microsoft等封闭生态系统"，还是"基于MCP＋LangChain/LangGraph/Agent Framework构建自有控制层"——这是一个关乎基础设施自主权的分岔路口。Harrison Chase在《Your harness, your memory》中写道"选择闭源，便意味着失去对自身数据的控制权"，正是针对这一分歧所发出的声音。

第8章　硅谷风险投资的资本配置与报道基调

2025年VC投资总体来看，AI相关融资总额从2024年的1140亿美元（约17.1万亿日元）飙升75%，突破2020亿美元（约30.3万亿日元），占全部VC投资的约一半。在独角兽级别交易中，主导交易数量最多的是Sequoia（51笔／21家独角兽）和a16z（50笔／20家）这对双子星，Greylock、Benchmark、Kleiner Perkins、IVP、Index Ventures、Accel、Lightspeed、Coatue、Insight Partners、General Catalyst紧随其后，深度参与Agentic RAG技术栈。a16z公开表示，在2025～26年间累计组建了逾150亿美元（约2.25万亿日元）的基金，单独撬动了美国VC投资额的18%。Sequoia与SoftBank、Google Ventures并肩，于2026年4月宣布规模70亿美元（约1.05万亿日元）的新基金，声称将进一步扩大AI投资。

阅读各家VC公开发布的思想文件，可以清晰看到他们对Agentic RAG的关注视角。a16z在2026年1月发布的《Big Ideas 2026》中将"AI数据转型层"列为基础性创业类别，指出RAG系统面临"因信息源相互矛盾或过时而产生的幻觉，以及Agent工作流以精细而高昂的代价崩溃"等问题，并论证数据质量才是真正的瓶颈。Sequoia在《2026: This is AGI》中宣称"长期视野的Agent在功能上已是AGI，而2026年将是那一年"，在《AI in 2026: A Tale of Two AIs》中则强调从副驾驶向自主Agent的转变。Bessemer Venture Partners在《AI Infrastructure Roadmap: Five frontiers for 2026》中分析称"推理工作负载在算力需求和经济重要性上已与训练旗鼓相当，在许多情况下甚至超越训练"，并明确表示正在密切关注TensorMesh（LMCache）、RadixArk（SGLang路由）、Inferact（vLLM）等专注Agent的基础设施。

各媒体的报道基调也呈现出一定的趋同。TechCrunch在2025年10月21日的《Open-source agentic startup LangChain hits $1.25B valuation》中详细报道了LangChain的情况；在2026年3月25日的《Harvey confirms $11B valuation, Sequoia triples down》中强调了Sequoia对垂直Agentic RAG的坚定信念；在2026年4月16日的《New leaders, new fund: Sequoia has raised $7B to expand its AI bets》中追踪了Sequoia的资本承诺。The Information率先报道了Pinecone出售传闻，Bloomberg于2026年1月28日在《AI customer support startup Decagon valued at $4.5 billion》中传递了垂直Agent的急速增长。CNBC在2025年6月10日的《Glean raises $150M at $7.2 billion valuation》中追踪了Agent向大型企业的渗透。Fortune在2025年10月20日的独家采访中披露了LangChain的ARR情况，VentureBeat则多次引用Contextual AI的基准测试结果。

纵观2025～2026年VC资本配置，可以看到明显的分化。框架层（LangChain、LlamaIndex、CrewAI）获得了数亿美元量级的资本注入，但估值仍停留在十亿美元一两位数规模。向量数据库层（Pinecone、Qdrant、Chroma）持续获得5000万～1亿美元规模的融资，但类别王者Pinecone已在考虑出售，开始显现出被开源方案与超大规模云厂商夹击的压力。与此形成鲜明对比的是，垂直Agentic RAG（Harvey、Sierra、Decagon、Hebbia、Glean、Cohere）单笔即可连续完成数亿至十亿美元级别的融资，估值也攀升至45亿～110亿美元。从ARR与估值的倍数对比来看，垂直侧的资本效率明显更高。这正是VC们在OpenAI、Anthropic、Google DeepMind垄断平台侧知识优势的背景下，判断"在基础模型之上全面承接业务的垂直Agent"将获得最大经济价值的有力佐证。

批判性声音也在同期涌现。Gartner在2025年6月25日的新闻稿中警告称"超过40%的Agent型AI项目将在2027年底前被取消"，并将治理缺失和可观测性不足列为主因。麦肯锡2025年秋季发布的《State of AI 2025》报告指出，超过80%的企业尚未感受到生成式AI对营收的实质贡献，成功将AI Agent在单项功能上规模化落地的组织不足10%。SaaStr的Jason Lemkin在2025年的《SaaS Vibe Check》中反复强调"赢家既是建设者，也是故事讲述者"，同时警告"没有观测与评估机制的生产环境AI Agent是定时炸弹"。Anthropic多Agent评估所揭示的"标准对话15倍token消耗"这一事实，作为成本问题的缩影，被反复援引。

第9章　2026年下半年至2027年预测的新动向

综合多家风险投资机构、分析师及智库的预测，未来12至18个月内可观察到的动向轮廓已相对清晰。

其一，长期记忆与智能体框架（Agent Harness）的标准化竞争全面提速。 LangChain Deep Agents、Microsoft Agent Framework 1.0、OpenAI Responses API、Anthropic Claude＋MCP、Databricks Genie Code这五大主流框架，将在2026年下半年至2027年间争夺"智能体操作系统"的宝座。最终胜负或许还需数年方能揭晓，但MCP捐赠给Linux Foundation一事，至少已使连接器层实现了中立化。2026年5月13至14日在旧金山召开的LangChain大会（Harrison Chase、Jensen Huang、Andrew Ng出席），将成为开放系框架阵营凝聚共识的重要场合。

其二，垂直领域Agentic RAG的行业类别领导者格局逐步确立。 Harvey（法务）、Hebbia（金融）、Sierra（客户服务）、Decagon（客户服务/AI礼宾）、Glean（企业搜索）、Writer（内容）、Harvey的潜在竞争者Spellbook、EvenUp（保险及人身伤害）、Norm Ai（合规）等，各行业中"提到Agentic RAG就想到这家"的单一寡头化趋势正在推进。Sequoia、a16z、Coatue、Index Ventures预计将在此阶段持续追加投资，将其推向IPO水准。Cohere是最有力的IPO候选，目标窗口为2026年第二至第三季度。

其三，向量数据库层的整合重组提速。 若Pinecone完成收购，Oracle、IBM、Snowflake、MongoDB中的某一方将纳入该类别领导者，与开源系的Weaviate、Qdrant、Milvus之间的生态分野也将更为清晰。与此同时，若由对象存储驱动的Turbopuffer和LanceDB深度整合进阿里云、AWS、Azure的原生服务，"向量数据库独立类别"本身或将面临瓦解。Edo Liberty所描绘的"向量数据库成为企业级长期记忆"愿景能否落地，最迟到2027年将见分晓。

其四，评估与可观测性基础设施迎来爆发式增长。 LangSmith、Arize、Galileo、TruEra、Ragas、Phoenix、Braintrust等评估与观测平台，在2025至2026年间已持续完成数千万美元级别的融资。正如Gartner"40%项目将被叫停"的警告所揭示的，智能体型项目成败的关键，归根结底在于"能否观察生产环境中的行为、能否以数字化方式管控质量"。预计2026年下半年起，AI可观测性将作为独立类别形成完整生态。

其五，日本企业加速进军企业级Agentic RAG市场。 据多方报道，乐天、NTT Data、富士通、NEC、KDDI、软银、Mercari、LINE雅虎等大型IT及电信企业将相继发布面向法人的Agentic RAG产品。此外，NTT的tsuzumi、富士通的Takane、NEC的cotomi等国产大模型与Cohere、Claude等海外模型组合而成的混合架构，预计将成为主流。随着政府采购中主权AI要求的逐步落地，Cohere等以"主权AI"为旗帜的厂商在日本市场的存在感有望显著提升。

其六，智能体间互操作协议（Agent-to-Agent，A2A）成为下一个标准化战场。 Microsoft Agent Framework已将A2A＋MCP的跨运行时互操作列为核心目标，其他厂商亦纷纷跟进，AAIF（Agentic AI Foundation）有望主导该领域通用规范的制定。一旦智能体将任务委托给另一智能体的机制得到标准化，Agentic RAG将从"单一智能体检索"演进为"智能体生态系统协同检索"。Singh et al.综述论文中所描述的"多智能体协作"阶段，在实现层面真正落地，有望于2027年前后实现。

第10章　结语 —— Agentic RAG：从"检索工具"到"智能基础设施"

截至2026年4月，硅谷风险投资资本所揭示的事实是：RAG这一概念已超越"检索工具"的范畴，演化为企业级智能基础设施本身。Pinecone创始人Edo Liberty所言"向量数据库将转型为企业的长期记忆"的预言，Databricks联合创始人、2026年ACM Computing奖得主Matei Zaharia所观察到的"AGI已然在此，只是尚未以我们所评估的形式存在"，Harrison Chase所主张的"执行框架与记忆系统应当保持开放"的理念，以及Douwe Kiela所践行的"将检索与生成整合为单一系统的RAG 2.0"的工程雄心——这些思想的交汇之处，正在崛起一个名为Agentic RAG的现在进行时的基础设施层。

硅谷的风险投资机构将Agentic RAG视为决定企业软件未来十年走向的构造性变革，而非AI的一个子议题。IVP以125亿美元估值投资LangChain，Sequoia三度押注Harvey，a16z领投Hebbia与Decagon的增长，Coatue持续押注垂直智能体，Greycroft／Bain／Lightspeed支撑Contextual AI的RAG 2.0，Wellington Management作为传统资产管理公司入局Glean——这种多层次的资本配置模式表明，Agentic RAG是一个横跨"基础设施投资"、"企业应用投资"与"生产力投资"三大领域的、射程极为宽广的主题。

另一方面，Gartner预测的"40%项目取消率"、Anthropic报告的"15倍Token消耗"、麦肯锡指出的"不足10%的规模化落地率"，也暗示泡沫与预期的调整阶段难以避免。从2026年下半年至2027年，Agentic RAG将从"随处可用的魔法"这一期待，走向成熟——成为"具备明确ROI与可观测性、深度嵌入业务流程的基础设施"。在此过程中，赢家与输家将泾渭分明。硅谷工程师当下真正需要审视的，并非某个特定框架或向量数据库的选型本身，而是一个更为根本的架构判断："在哪一层控制平面之上承载企业的长期记忆？"待到2027年回望Agentic RAG之时，我们将把它铭记为"AI应用设计思想从流水线范式向流程范式迁移的历史转折点"。

第10章　结语 —— Agentic RAG：从"检索工具"到"智能基础设施"

截至2026年4月，硅谷风险投资资本所揭示的事实是：RAG这一概念已经超越了"检索工具"的范畴，进化为企业级知识基础设施本身。Pinecone创始人Edo Liberty所预言的"向量数据库将转型为企业的长期记忆"，Databricks联合创始人、2026年ACM计算奖得主Matei Zaharia所观察到的"AGI已经存在，只是尚未以我们所评估的形式呈现"，Harrison Chase所主张的"harness与记忆应当保持开放"的理念，以及Douwe Kiela所践行的"将检索与生成整合为单一系统的RAG 2.0"的工程抱负——这些思想的交汇之处，正在崛起一个名为Agentic RAG的现在进行时的基础设施层。

硅谷的风险投资机构将Agentic RAG视为决定企业软件下一个十年的构造性变革，而非AI的一个子议题。IVP对LangChain给出12.5亿美元的估值，Sequoia三度投资Harvey，a16z领投Hebbia与Decagon的成长，Coatue持续押注垂直领域智能体，Greycroft、Bain、Lightspeed支持Contextual AI的RAG 2.0，Wellington Management作为传统资产管理公司入局Glean——这种多层次的资本配置模式表明，Agentic RAG是一个横跨"基础设施投资"、"企业应用投资"与"生产力投资"三大领域的、射程极为宽广的主题。

另一方面，Gartner预测的"40%取消率"、Anthropic报告的"15倍token消耗"、麦肯锡指出的"规模化落地不足10%"等现实，也暗示着泡沫与预期的调整阶段难以避免。从2026年下半年到2027年，Agentic RAG将从"随处可用的魔法"这一期待，走向"具备明确ROI与可观测性、深度嵌入业务流程的基础设施"的成熟阶段。在这一过程中，胜者与败者将泾渭分明。硅谷工程师当下应当关注的，不是某个特定框架或向量数据库的选型本身，而是"在哪个控制层之上承载自身的长期记忆"这一更为根本的架构判断。当我们在2027年回望Agentic RAG时，将会把它铭记为"AI应用的设计理念从流水线式向流程式转型的历史转折点"。

来源

Singh, Ehtesham, Kumar, Khoei, Vasilakos，"Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG"（arXiv:2501.09136）— https://arxiv.org/abs/2501.09136
Asai 等，"Self-RAG: Learning to Retrieve, Generate, and Critique through Self-Reflection"（arXiv:2310.11511）— https://arxiv.org/abs/2310.11511
Yan 等，"Corrective Retrieval Augmented Generation"（arXiv:2401.15884）— https://arxiv.org/abs/2401.15884
Jeong, Baek, Cho, Hwang, Park，"Adaptive-RAG"（arXiv:2403.14403）— https://arxiv.org/abs/2403.14403
Yao 等，"ReAct: Synergizing Reasoning and Acting in Language Models"（arXiv:2210.03629）— https://arxiv.org/abs/2210.03629
Edge 等，微软研究院，"From Local to Global: A Graph RAG Approach to Query-Focused Summarization"（arXiv:2404.16130）— https://arxiv.org/abs/2404.16130
微软研究院，"LazyGraphRAG: Setting a new standard for quality and cost" — https://www.microsoft.com/en-us/research/blog/lazygraphrag-setting-a-new-standard-for-quality-and-cost/
微软研究院，GraphRAG 项目 — https://www.microsoft.com/en-us/research/project/graphrag/
微软研究院，"BenchmarkQED: Automated benchmarking of RAG systems" — https://www.microsoft.com/en-us/research/blog/benchmarkqed-automated-benchmarking-of-rag-systems/
Anthropic 工程团队，"How we built our multi-agent research system" — https://www.anthropic.com/engineering/multi-agent-research-system
Anthropic，"Introducing Contextual Retrieval" — https://www.anthropic.com/news/contextual-retrieval
Anthropic，"Introducing the Model Context Protocol" — https://www.anthropic.com/news/model-context-protocol
Anthropic，"Donating the Model Context Protocol and establishing the Agentic AI Foundation" — https://www.anthropic.com/news/donating-the-model-context-protocol-and-establishing-of-the-agentic-ai-foundation
模型上下文协议规范 2025-11-25 — https://modelcontextprotocol.io/specification/2025-11-25
NVIDIA 开发者博客，"Traditional RAG vs Agentic RAG — Why AI Agents Need Dynamic Knowledge to Get Smarter" — https://developer.nvidia.com/blog/traditional-rag-vs-agentic-rag-why-ai-agents-need-dynamic-knowledge-to-get-smarter/
NVIDIA AI Blueprints，RAG 参考实现 — https://github.com/NVIDIA-AI-Blueprints/rag
Cohere，"Rerank" — https://cohere.com/rerank
Cohere 文档，"Command A" — https://docs.cohere.com/docs/command-a
BAAI，"BGE Reranker v2-m3" — https://huggingface.co/BAAI/bge-reranker-v2-m3
Khattab 与 Zaharia，"ColBERT"（arXiv:2004.12832）— https://arxiv.org/abs/2004.12832
OpenAI，"New Tools for Building Agents" — https://openai.com/index/new-tools-for-building-agents/
OpenAI，"New tools and features in the Responses API" — https://openai.com/index/new-tools-and-features-in-the-responses-api/
OpenAI 开发者，"Responses API tool orchestration" — https://developers.openai.com/cookbook/examples/responses_api/responses_api_tool_orchestration
OpenAI 平台文档，"Deep Research Guide" — https://platform.openai.com/docs/guides/deep-research
Andreessen Horowitz，"Big Ideas 2026（第一部分）" — https://a16z.com/newsletter/big-ideas-2026-part-1/
Andreessen Horowitz，"The Rise of Computer Use and Agentic Coworkers" — https://a16z.com/the-rise-of-computer-use-and-agentic-coworkers/
Andreessen Horowitz，"Vector Databases and the Power of RAG" — https://a16z.com/podcast/vector-databases-and-the-power-of-rag/
Andreessen Horowitz，"Investing in Hebbia" — https://a16z.com/announcement/investing-in-hebbia/
Sequoia Capital，"2026: This is AGI" — https://sequoiacap.com/article/2026-this-is-agi/
Sequoia Capital，"AI in 2026: A Tale of Two AIs" — https://sequoiacap.com/article/ai-in-2026-the-tale-of-two-ais/
Sequoia Capital 播客，"Context Engineering Our Way to Long-Horizon Agents"（Harrison Chase）— https://sequoiacap.com/podcast/context-engineering-our-way-to-long-horizon-agents-langchains-harrison-chase/
Sequoia Capital，"LangChain: From Agent 0 to 1 to Agentic Engineering" — https://sequoiacap.com/article/langchain-from-agent-0-to-1-to-agentic-engineering/
Bessemer Venture Partners，"AI Infrastructure Roadmap: Five frontiers for 2026" — https://www.bvp.com/atlas/ai-infrastructure-roadmap-five-frontiers-for-2026
Bessemer Venture Partners，"Securing AI Agents" — https://www.bvp.com/atlas/securing-ai-agents-the-defining-cybersecurity-challenge-of-2026
Gartner 新闻稿，"到 2026 年 40% 的企业应用将具备特定任务 AI 代理" — https://www.gartner.com/en/newsroom/press-releases/2025-08-26-gartner-predicts-40-percent-of-enterprise-apps-will-feature-task-specific-ai-agents-by-2026-up-from-less-than-5-percent-in-2025
Gartner 新闻稿，"超过 40% 的 Agentic AI 项目将在 2027 年底前被取消" — https://www.gartner.com/en/newsroom/press-releases/2025-06-25-gartner-predicts-over-40-percent-of-agentic-ai-projects-will-be-canceled-by-end-of-2027
Gartner，具备 Agentic AI 的供应链管理软件 530 亿美元预测 — https://www.gartner.com/en/newsroom/press-releases/2026-04-07-gartner-forecasts-supply-chain-management-software-with-agentic-ai-will-grow-to-53-billion-in-spend-by-2030
麦肯锡，"2026 年 AI 信任状况：迈向 Agentic 时代" — https://www.mckinsey.com/capabilities/tech-and-ai/our-insights/tech-forward/state-of-ai-trust-in-2026-shifting-to-the-agentic-era
麦肯锡，"Seizing the Agentic AI Advantage" — https://www.mckinsey.com/capabilities/quantumblack/our-insights/seizing-the-agentic-ai-advantage
麦肯锡，"The State of AI 2025: Agents, Innovation" — https://www.mckinsey.com/~/media/mckinsey/business%20functions/quantumblack/our%20insights/the%20state%20of%20ai/november%202025/the-state-of-ai-2025-agents-innovation_cmyk-v1.pdf
MarketsandMarkets，RAG 市场报告 — https://www.marketsandmarkets.com/PressReleases/retrieval-augmented-generation-rag.asp
MarketsandMarkets，向量数据库市场 — https://www.marketsandmarkets.com/Market-Reports/vector-database-market-112683895.html
Grand View Research，RAG 市场 — https://www.grandviewresearch.com/industry-analysis/retrieval-augmented-generation-rag-market-report
Fortune Business Insights，Agentic AI 市场 — https://www.fortunebusinessinsights.com/agentic-ai-market-114233
LangChain 博客，"B 轮融资公告" — https://blog.langchain.com/series-b/
TechCrunch，"开源 Agentic 初创公司 LangChain 估值达 12.5 亿美元" — https://techcrunch.com/2025/10/21/open-source-agentic-startup-langchain-hits-1-25b-valuation/
Fortune，"早期 AI 明星 LangChain 成为独角兽" — https://fortune.com/2025/10/20/exclusive-early-ai-darling-langchain-is-now-a-unicorn-with-a-fresh-125-million-in-funding/
LangChain 博客，"Your harness, your memory" — https://www.langchain.com/blog/your-harness-your-memory
LangChain 博客，NVIDIA 企业合作伙伴关系 — https://blog.langchain.com/nvidia-enterprise/
LangChain 通讯，2026 年 3 月 — https://www.langchain.com/blog/march-2026-langchain-newsletter
TechCrunch，"LlamaIndex 推出用于构建非结构化数据代理的云服务" — https://techcrunch.com/2025/03/04/llamaindex-launches-a-cloud-service-for-building-unstructed-data-agents/
LlamaIndex 博客，"A 轮融资及 LlamaCloud 正式发布" — https://www.llamaindex.ai/blog/announcing-our-series-a-and-llamacloud-general-availability
LlamaIndex 博客，"LlamaIndex 不仅仅是一个 RAG 框架" — https://www.llamaindex.ai/blog/llamaindex-is-more-than-a-rag-framework
PRNewswire，"LlamaIndex 完成 1900 万美元 A 轮融资" — https://www.prnewswire.com/news-releases/llamaindex-secures-19-million-series-a-to-power-enterprise-grade-knowledge-agents-302390936.html
Norwest Venture Partners，"LlamaIndex" — https://www.norwest.com/blog/llamaindex-harnesses-the-power-of-enterprise-data-for-ai-agent-workflows/
Pulse2，"CrewAI 多智能体平台完成 1800 万美元 A 轮融资" — https://pulse2.com/crewai-multi-agent-platform-raises-18-million-series-a/
Insight Partners，"CrewAI ScaleUp AI 故事" — https://www.insightpartners.com/ideas/crewai-scaleup-ai-story/
Enterprise AI World，CrewAI 1800 万美元融资 — https://www.enterpriseaiworld.com/Articles/News/News/$18M-in-Funding-Catapults-CrewAIs-Multi-Agentic-Platform-to-the-Enterprise-Level-166495.aspx
deepset，"Balderton Capital 融资公告" — https://www.deepset.ai/news/funding-announcement-balderton-capital
deepset，"Introducing Haystack Enterprise Platform" — https://www.deepset.ai/blog/introducing-haystack-enterprise-platform
Visual Studio Magazine，"微软发布可用于生产的 Agent Framework 1.0" — https://visualstudiomagazine.com/articles/2026/04/06/microsoft-ships-production-ready-agent-framework-1-0-for-net-and-python.aspx
Microsoft Learn，"Agent Framework 概述" — https://learn.microsoft.com/en-us/agent-framework/overview/
Visual Studio Magazine，"Semantic Kernel + AutoGen 开源微软 Agent Framework" — https://visualstudiomagazine.com/articles/2025/10/01/semantic-kernel-autogen--open-source-microsoft-agent-framework.aspx
Dify — https://dify.ai/
Pinecone 博客，"B 轮融资" — https://www.pinecone.io/blog/series-b/
TechCrunch，"Pinecone 以 7.5 亿美元估值完成 1 亿美元投资" — https://techcrunch.com/2023/04/27/pinecone-drops-100m-investment-on-750m-valuation-as-vector-database-demand-grows/
VentureBeat，"Pinecone 创始人 Edo Liberty 任命谷歌人 Ash 担任 CEO" — https://venturebeat.com/data-infrastructure/pinecone-founder-edo-liberty-appoints-googler-ash-as-ceo
PRNewswire，Pinecone CEO 交接 — https://www.prnewswire.com/news-releases/pinecone-founder-edo-liberty-to-spearhead-pinecones-growing-ai-ambitions-appoints-ash-ashutosh-as-ceo-to-expand-vector-database-market-leadership-302549334.html
Calcalist Tech，Pinecone 出售猜测 — https://www.calcalistech.com/ctechnews/article/rz31q82b5
TechTarget SearchDataManagement，Pinecone 展望未来 — https://www.techtarget.com/searchdatamanagement/news/366631366/Vector-database-vendor-Pinecone-eyes-future-under-new-CEO
Pinecone 博客，"Pinecone Assistant 正式发布" — https://www.pinecone.io/blog/pinecone-assistant-generally-available/
Weaviate，"Weaviate B 轮融资" — https://www.prnewswire.com/news-releases/weaviate-raises-50-million-series-b-funding-to-meet-soaring-demand-for-ai-native-vector-database-technology-301803296.html
Weaviate，Weaviate 走向全栈 — https://www.globenewswire.com/news-release/2025/03/04/3036570/0/en/Weaviate-Goes-Full-Stack-With-Launch-of-Weaviate-Agents-for-AI-Development.html
Weaviate 博客，Query Agent — https://weaviate.io/blog/query-agent
Weaviate 博客，2025 年度回顾 — https://weaviate.io/blog/weaviate-in-2025
Weaviate，Agent Skills 发布 — https://www.globenewswire.com/news-release/2026/02/21/3242244/0/en/Weaviate-Launches-Agent-Skills-to-Empower-AI-Coding-Agents.html
Weaviate，GigaOm 领导者 / Gartner 新兴领导者认可 — https://www.globenewswire.com/news-release/2026/01/14/3218396/0/en/Weaviate-named-a-Leader-and-Outperformer-by-GigaOm-and-Emerging-Leader-by-Gartner-Market-Momentum-Accelerates-as-Nonrelational-DBMS-Segment-Grows-22-7.html
TechCrunch，"Qdrant 开源向量数据库" — https://techcrunch.com/2024/01/23/qdrant-open-source-vector-database/
Qdrant 博客，"A 轮融资" — https://qdrant.tech/blog/series-a-funding-round/
BusinessWire，"Qdrant 完成 5000 万美元 B 轮融资" — https://www.businesswire.com/news/home/20260312313902/en/Qdrant-Raises-$50-Million-Series-B-to-Define-Composable-Vector-Search-as-Core-Infrastructure-for-Production-AI
Chroma 公司，"种子轮" — https://www.trychroma.com/company/seed
Medium，"我们对 Chroma 的投资（Astasia Myers）" — https://medium.com/memory-leak/our-investment-in-chroma-the-developer-centric-embedding-database-34277ac327e8
Salestools，Chroma B 轮融资报告 — https://salestools.io/en/report/chroma-raises-18m-series-b
TechCrunch，"Zilliz 迁往旧金山，完成 6000 万美元融资" — https://techcrunch.com/2022/08/24/zilliz-the-startup-behind-the-milvus-open-source-vector-database-for-ai-applications-raises-60m-and-relocates-to-sf/
Yahoo Finance，"Milvus GitHub 星标突破 40000" — https://finance.yahoo.com/news/milvus-surpasses-40-000-github-010000562.html
TechCrunch，Vespa 分拆 — https://techcrunch.com/2023/10/04/yahoo-spins-out-vespa-its-search-tech-into-an-independent-company/
Vespa.ai，Blossom Capital 融资 — https://vespa.ai/2023-11-01-blossom-funding/
Tracxn，LanceDB 简介 — https://tracxn.com/d/companies/lancedb/__ie1HuEEUoPOIc3tEX5yowY9yMJz9kdNTH01mwCePxLw
BetaKit，Turbopuffer 完成新一轮融资 — https://betakit.com/ex-shopify-engineers-raise-fresh-financing-to-scale-turbopuffers-ai-search/
Turbopuffer，关于 — https://turbopuffer.com/about
SiliconANGLE，Contextual AI 获 8000 万美元用于 RAG 2.0 — https://siliconangle.com/2024/08/02/contextual-ai-nabs-80m-rag-2-0-platform/
Contextual AI 博客，平台正式发布 — https://contextual.ai/blog/platform-ga-press-release
Contextual AI 研究，RAG 2.0 介绍 — https://contextual.ai/research/introducing-rag2
VentureBeat，Contextual AI 优于 GPT-4o — https://venturebeat.com/ai/contextual-ais-new-ai-model-crushes-gpt-4o-in-accuracy-heres-why-it-matters
VentureBeat，Contextual AI Agent Composer — https://venturebeat.com/technology/contextual-ai-launches-agent-composer-to-turn-enterprise-rag-into-production
Morningstar PRNewswire，Agent Composer 发布 — https://www.morningstar.com/news/pr-newswire/20260127sf71236/contextual-ai-launches-agent-composerai-for-when-it-actually-is-rocket-science
TechCrunch，"Cohere 估值达 70 亿美元，与 AMD 建立合作" — https://techcrunch.com/2025/09/24/cohere-hits-7b-valuation-a-month-after-its-last-raise-partners-with-amd/
PSP Investments / Cohere 融资公告 — https://www.investpsp.com/en/news/fresh-funding-enables-cohere-to-accelerate-its-global-expansion-and-build-the-next-generation-of-secure-enterprise-and-sovereign-ai-solutions/
Futurum Group，"Cohere 多语言主权 AI 护城河——迈向 2026 年 IPO" — https://futurumgroup.com/insights/coheres-multilingual-sovereign-ai-moat-ahead-of-a-2026-ipo/
InfoWorld，"Cohere 北上布局 Agentic AI" — https://www.infoworld.com/article/3757962/cohere-goes-north-with-agentic-ai.html
Vectara A 轮融资，BusinessWire — https://www.businesswire.com/news/home/20240716489550/en/Vectara-Secures-%2425-Million-Series-A-Funding-to-Advance-the-Trustworthiness-of-Retrieval-Augmented-Generation-with-New-Mockingbird-LLM
Glean，F 轮 1.5 亿美元融资 — https://www.glean.com/press/glean-raises-150m-series-f-at-7-2b-valuation-to-accelerate-enterprise-ai-agent-innovation-globally
TechCrunch，Glean 估值 72 亿美元 — https://techcrunch.com/2025/06/10/enterprise-ai-startup-glean-lands-a-7-2b-valuation/
CNBC，Glean 1.5 亿美元 F 轮融资 — https://www.cnbc.com/2025/06/10/glean-gen-ai-search-startup-raises-150-million-at-7-billion-value.html
TechCrunch，Perplexity 以 200 亿美元估值完成 2 亿美元融资 — https://techcrunch.com/2025/09/10/perplexity-reportedly-raised-200m-at-20b-valuation/
Writer.com，C 轮融资公告 — https://writer.com/blog/series-c-funding-writer-press-release/
TechCrunch，Writer 以 19 亿美元估值完成 2 亿美元融资 — https://techcrunch.com/2024/11/12/generative-ai-startup-writer-raises-200m-at-a-1-9b-valuation/
TechCrunch，Hebbia 1.3 亿美元 B 轮融资 — https://techcrunch.com/2024/07/09/ai-startup-hebbia-rased-130m-at-a-700m-valuation-on-13-million-of-profitable-revenue/
Hebbia 博客，B 轮融资 — https://www.hebbia.com/blog/hebbia-raises-usd130m-series-b
TechCrunch，Harvey 估值 110 亿美元 — https://techcrunch.com/2026/03/25/harvey-confirms-11b-valuation-sequoia-triples-down/
CNBC，Harvey 以 110 亿美元估值完成 2 亿美元融资 — https://www.cnbc.com/2026/03/25/legal-ai-startup-harvey-raises-200-million-at-11-billion-valuation.html
Harvey，融资系列公告 — https://www.harvey.ai/blog/harvey-raises-at-dollar11-billion-valuation-to-scale-agents-across-law-firms-and-enterprises
TechCrunch，Harvey 2025 年 12 月估值 80 亿美元 — https://techcrunch.com/2025/12/04/legal-ai-startup-harvey-confirms-8b-valuation/
TechCrunch，Bret Taylor 的 Sierra 以 100 亿美元估值完成 3.5 亿美元融资 — https://techcrunch.com/2025/09/04/bret-taylors-sierra-raises-350m-at-a-10b-valuation/
TechCrunch，Sierra ARR 突破 1 亿美元 — https://techcrunch.com/2025/11/21/bret-taylors-sierra-reaches-100m-arr-in-under-two-years/
CNBC，Sierra 估值 100 亿美元 — https://www.cnbc.com/2025/09/04/bret-taylor-sierra-ai-startup-salesforce-openai.html
Decagon 博客，D 轮融资公告 — https://decagon.ai/blog/series-d-announcement
Bloomberg，Decagon 估值 45 亿美元 — https://www.bloomberg.com/news/articles/2026-01-28/ai-customer-support-startup-decagon-valued-at-4-5-billion
Decagon 博客，C 轮融资 — https://decagon.ai/resources/series-c-announcement
BusinessWire，Decagon D 轮融资 — https://www.businesswire.com/news/home/20260128580542/en/Decagons-Valuation-Triples-to-$4.5-Billion-as-it-Ushers-in-the-Age-of-AI-Concierge
Sana Labs，B 轮融资公告 — https://sanalabs.com/resources/announcing-sanas-series-b-round
Sana Labs，B 轮融资追加 — https://sanalabs.com/resources/sana-reaches-62m-dollars-in-series-b-funding
You.com，C 轮融资公告 — https://you.com/resources/series-c
TechStartups，You.com 以 15 亿美元估值完成 1 亿美元 C 轮融资 — https://techstartups.com/2025/09/04/you-com-raises-100m-series-c-in-funding-at-1-5b-valuation-to-scale-ai-search-infrastructure/
TechCrunch，Databricks 以 1340 亿美元估值完成 40 亿美元融资 — https://techcrunch.com/2025/12/16/databricks-raises-4b-at-134b-valuation-as-its-ai-business-heats-up/
Databricks，MosaicML 收购 — https://www.databricks.com/company/newsroom/press-releases/databricks-completes-acquisition-mosaicml
Databricks 博客，Genie Code — https://www.databricks.com/blog/introducing-genie-code
Databricks，Agent Bricks 发布 — https://www.databricks.com/company/newsroom/press-releases/databricks-launches-agent-bricks-new-approach-building-ai-agents
TechCrunch，Matei Zaharia 荣获 ACM 计算奖 — https://techcrunch.com/2026/04/08/databricks-matei-zaharia-wins-acm-computing-prize-agi/
TechCrunch，Sequoia 为 AI 募资 70 亿美元 — https://techcrunch.com/2026/04/16/new-leaders-new-fund-sequoia-has-raised-7b-to-expand-its-ai-bets/
Snowflake 发布说明，Cortex Agents 正式发布 — https://docs.snowflake.com/en/release-notes/2025/other/2025-11-04-cortex-agents
Snowflake，Cortex 概述 — https://www.snowflake.com/en/product/features/cortex/
Snowflake，Cortex Code — https://www.snowflake.com/en/product/features/cortex-code/
SaaStr，"2025 年 SaaS 现状检验（Jason Lemkin）" — https://www.saastr.com/the-2025-saas-vibe-check-what-founders-need-to-know-right-now-with-saastr-ceo-and-founder-jason-lemkin/
Jahanzaib.ai，"Agentic RAG 生产指南" — https://www.jahanzaib.ai/blog/agentic-rag-production-guide
Suprmind，"AI 幻觉率与基准测试" — https://suprmind.ai/hub/ai-hallucination-rates-and-benchmarks/

深度解析：已成为RAG主流的"Agentic RAG（智能体型RAG）"

第1章　为何当今的RAG不得不走向"Agentic"

第2章　Agentic RAG的核心技术与设计模式

第3章　框架／编排层 —— LangChain、LlamaIndex、CrewAI，以及微软

第4章　向量数据库／检索基础层 —— Pinecone、Weaviate、Qdrant、Chroma、Turbopuffer

第5章　端到端/情境化系平台 —— Contextual AI、Cohere、Vectara

第6章　垂直专业化的Agentic RAG —— Harvey、Hebbia、Sierra、Decagon、Glean

第7章　MCP与生态系统标准化 —— 为什么Anthropic将MCP捐赠给Linux基金会

第8章　硅谷风险投资的资本配置与报道基调

第9章　2026年下半年至2027年预测的新动向

第10章　结语 —— Agentic RAG：从"检索工具"到"智能基础设施"

第10章　结语 —— Agentic RAG：从"检索工具"到"智能基础设施"

来源

関連サービス

関連投資家

深度解析：已成为RAG主流的"Agentic RAG（智能体型RAG）"

第1章 为何当今的RAG不得不走向"Agentic"

第2章 Agentic RAG的核心技术与设计模式

第3章 框架／编排层 —— LangChain、LlamaIndex、CrewAI，以及微软

第4章 向量数据库／检索基础层 —— Pinecone、Weaviate、Qdrant、Chroma、Turbopuffer

第5章 端到端/情境化系平台 —— Contextual AI、Cohere、Vectara

第6章 垂直专业化的Agentic RAG —— Harvey、Hebbia、Sierra、Decagon、Glean

第7章 MCP与生态系统标准化 —— 为什么Anthropic将MCP捐赠给Linux基金会

第8章 硅谷风险投资的资本配置与报道基调

第9章 2026年下半年至2027年预测的新动向

第10章 结语 —— Agentic RAG：从"检索工具"到"智能基础设施"

第10章 结语 —— Agentic RAG：从"检索工具"到"智能基础设施"

来源

関連サービス

関連投資家

第1章　为何当今的RAG不得不走向"Agentic"

第2章　Agentic RAG的核心技术与设计模式

第3章　框架／编排层 —— LangChain、LlamaIndex、CrewAI，以及微软

第4章　向量数据库／检索基础层 —— Pinecone、Weaviate、Qdrant、Chroma、Turbopuffer

第5章　端到端/情境化系平台 —— Contextual AI、Cohere、Vectara

第6章　垂直专业化的Agentic RAG —— Harvey、Hebbia、Sierra、Decagon、Glean

第7章　MCP与生态系统标准化 —— 为什么Anthropic将MCP捐赠给Linux基金会

第8章　硅谷风险投资的资本配置与报道基调

第9章　2026年下半年至2027年预测的新动向

第10章　结语 —— Agentic RAG：从"检索工具"到"智能基础设施"

第10章　结语 —— Agentic RAG：从"检索工具"到"智能基础设施"