第1章 为何当今的RAG不得不走向"Agentic"
Douwe Kiela等人在Facebook AI Research时期于2020年向arXiv投稿的论文《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》,是当今"RAG"一词的起源。该论文所提出的流程后来被称为"Naive RAG"——将查询转换为Embedding,在向量空间中检索最近邻的k个片段,并将其作为上下文插入LLM,是一种简单的管道设计。2022年末ChatGPT问世后,这种Naive RAG以Bugatti级的速度得到普及,但从2023年到2024年,企业级实施现场暴露出三堵墙。
第一,试图用单一Embedding空间表达所有查询的设计,对于意图混杂的长查询或需要多步推理的问题,在结构上存在天然缺陷。第二,向量检索擅长返回"语义上相似"的文档,却无法保证返回"对查询而言事实正确"的文档。第三,企业数据不仅限于非结构化文档,还分散在SQL表、知识图谱、API、实时事件等各处,将所有数据塞入单一向量数据库的方案本身就不切实际。
学术界在2023年至2024年间,连续涌现出一批突破这些局限的论文。Asai等人提出的Self-RAG(arXiv:2310.11511,2023年10月)引入了reflection token机制,让LLM自身判断"是否需要检索"以及"检索结果是否合理",为模型动态决定是否检索开辟了道路。Yan等人于2024年1月发表的CRAG(Corrective RAG,arXiv:2401.15884)展示了一种设计:轻量级检索评估器返回置信度分数,当置信度较低时触发Web搜索作为外部扩展。Jeong等人于2024年3月发表的Adaptive-RAG(arXiv:2403.14403,NAACL 2024录用)提出了三级路由架构——在前端放置一个对查询复杂度进行分类的小型语言模型,简单查询无需检索,中等查询进行单次检索,复杂查询则进行迭代检索。这些论文都建立在ReAct模式(Yao et al.,arXiv:2210.03629,ICLR 2023)这一"交错推理与行动"的基本设计之上,并在2025年初实际上形成了行业标准。
2025年1月,Singh、Ehtesham、Kumar、Khoei、Vasilakos等人将这一脉络系统化为《A Survey of Agentic Retrieval-Augmented Generation for Large Language Models》(arXiv:2501.09136),将RAG的演进整理为"Naive RAG → Advanced RAG → Modular RAG → Agentic RAG"四个世代。该论文将其定义为:"Agentic RAG通过嵌入反思(reflection)、规划(planning)、工具使用(tool use)、多智能体协作等设计模式,动态管理检索策略,迭代精炼上下文理解。"
从硅谷工程师的视角总结这一变化:Naive RAG是"函数调用",而Agentic RAG是"进程执行"。前者是从查询到答案的单向管道,后者则拥有状态与循环,在必要时执行重试、路由和工具调用,更接近操作系统进程的存在。Anthropic于2025年6月公开的工程博客《How we built our multi-agent research system》报告称,以Claude Opus 4为领导者、Claude Sonnet 4为子智能体的编排-工作者型架构,在内部评估中比单一智能体Claude Opus 4高出90.2%,定量展示了多智能体架构的优越性。与此同时,博客也坦率指出:"多智能体消耗的token约为标准对话的15倍","token使用量解释了浏览评估中80%的性能方差",这一性能是以成本为代价才能获得的。
市场数据同样印证了这一转变。Gartner在2025年8月26日的新闻稿中预测,2025年时不足5%的任务型AI智能体应用占比,将在2026年底跃升至40%。预测还显示,到2028年,33%的企业软件将内嵌智能体型AI,70%的AI应用将采用多智能体方式。据MarketsandMarketsReport,仅RAG市场本身就将从2025年的19.4亿美元(约2910亿日元)扩张至2030年的98.6亿美元(约1兆4790亿日元),CAGR为38.4%;Grand View Research估算CAGR为49.1%,2030年将达110亿美元(约1兆6500亿日元)。向量数据库市场方面,MarketsandMarkets预测将从2025年的26.5亿美元(约3975亿日元)增长至2030年的89.5亿美元(约1兆3425亿日元),CAGR为27.5%;Fortune Business Insights则预测智能体型AI整体市场规模将从2026年的91.4亿美元(约1兆3710亿日元)爆炸性增长至2034年的1391.9亿美元(约20兆8785亿日元),CAGR高达40.5%。这些数字将Agentic RAG从"少数AI实验室的实验"推上了"数万亿日元规模基础设施市场"的舞台。
第2章 Agentic RAG的核心技术与设计模式
如果工程师用一句话定义 Agentic RAG,那便是:"一个以检索作为工具调用的循环系统,在每次循环中更新状态与决策。"这一定义中,至少蕴含着六个相互独立的技术要素。
第一个要素是查询路由(query routing)、查询改写(rewriting)、查询分解(decomposition)以及 HyDE(假设文档嵌入,Hypothetical Document Embedding)。路由是指:接收到用户查询的智能体,需要判断应将其发送至向量数据库、转换为 SQL 查询、交由 Web 搜索处理,还是翻译为知识图谱的 Cypher 查询。改写是将用户口语化的表达转换为适合检索的标准形式,通常使用小型 LLM 来完成。分解是将"A 与 B 有何不同,C 又与之如何关联"这类复合问题拆分为多个子查询的过程。HyDE 是 Gao 等人(2022)提出的方法,其思路是让 LLM 针对用户查询生成一个假想回答,再对该假想回答进行嵌入并用于检索,从而缩小查询与文档之间的风格差距。
第二个要素是混合检索(hybrid search)。2025 年至 2026 年间,业界逐渐形成共识,收敛于"dense(密集向量)+ sparse(BM25 / SPLADE)+ 重排序"的三层结构。dense 捕捉语义相似性,sparse 捕捉词汇匹配性,两者相互弥补各自的不足。NVIDIA 在 GitHub 上公开的 RAG Blueprint 参考实现,支持以可插拔方式在 ElasticSearch 与 Milvus 之间切换,提供 dense+sparse 混合检索、多集合检索、GPU 加速索引与查询,并以 RRF(Reciprocal Rank Fusion)作为标准融合方案。Anthropic 于 2024 年 9 月发布的《Contextual Retrieval》在嵌入分块之前,使用 Claude 添加上下文说明前缀,实验结果令人瞩目:相较于简单嵌入,Top-20 检索失败率降低了 35%;结合 BM25 后降低 49%;结合重排序后降低 67%,一举重写了 RAG 索引前处理的实现标准。
第三个要素是重排序(reranking)。对 dense 检索与 sparse 检索所得的候选集,再施以计算成本更高的交叉编码器进行排序调整。Cohere 于 2024 年 9 月发布的 Rerank 3 支持 4K 上下文长度,该公司声称:"Rerank 仅将最相关的文档传入 RAG 流水线与智能体工作流,从而减少 token 消耗、降低延迟、提升精度。"BAAI 于 2024 年 3 月发布的 BGE Reranker v2 系列(v2-m3、v2-gemma、v2-minicpm-layerwise)已成为开源阵营的标准。Omar Khattab 等人提出的 ColBERT / ColBERTv2 采用"后期交互(late interaction)"的不同路径,以低两个数量级的 FLOPs 和高两个数量级的吞吐量达到 BERT 级别的效果,ColBERTv2 还将存储占用压缩了 6 至 10 倍。
第四个要素是自我反思(self-reflection)与自我修正。Self-RAG 的反思 token 机制和 CRAG 的置信度评分,均属于这一脉络。在实现层面,LangGraph 提供的条件边(conditional edge)模式是典型方案:通过插入判断"检索结果是否充分"、"生成结果是否与事实一致"的节点,动态驱动检索循环。基于 LangGraph 的 Adaptive RAG 将选择性路由与验证相结合,据多项实现基准报告,相较于静态 RAG,可将幻觉减少多达 78%。
第五个要素是图 RAG(GraphRAG)。Microsoft Research 的 Edge 等人在 arXiv:2404.16130 中公开了 GraphRAG,并于 2025 年 2 月发布 v2。GraphRAG 使用 LLM 从文档集合中构建实体知识图谱,并预先计算社区检测与社区摘要,形成两阶段索引。这使得在百万 token 规模语料库上的"全局语义理解"(global sensemaking)型查询——即针对整体趋势或全面摘要的查询——在覆盖性与多样性两个维度上均大幅超越纯向量 RAG。此外,2024 年 11 月发布的 LazyGraphRAG 将索引成本降低至与向量 RAG 相当(仅为完整 GraphRAG 的 0.1%),查询时成本为 GraphRAG Global Search 的 1/700,同时保持同等的回答质量,并以 4% 的查询成本在全局与局部两类查询中均超越 GraphRAG,实现了成本与质量的兼顾。LazyGraphRAG 已于 2025 年内集成至 Microsoft Discovery 与 Azure Local,在产品层面正式投入实战。
第六个要素是长期记忆与状态管理。Harrison Chase 于 2026 年 4 月发表的论文《Your harness, your memory》明确提出:应将智能体的短期记忆(会话内消息及较大的工具调用结果)与长期记忆(跨会话记忆)加以分离,并将记忆管理职责集中至智能体框架(harness)一侧。他在 LangChain Deep Agents 中实现了"基于文件系统的工作记忆"、"渐进式技能披露"与"分层安全",并强调"选择闭源方案意味着失去对自己数据的控制权",力主记忆层的开源化。这与 OpenAI 在 Responses API(2025 年 3 月发布)中将托管工具原语(file_search、web_search、function calling)内化的策略形成鲜明对立,构成一个思想分歧的节点,也成为 2026 年智能体 AI 讨论的核心议题。
在 2026 年的生产环境中,整合上述六个要素的实现成本绝非轻松。独立顾问 Jahanzaib 于 2026 年初发布的生产指南显示:标准检索的每次查询单价为 0.06 至 0.09 美元(约 9 至 14 日元),而复杂的多跳 Agentic RAG 则可飙升至 0.18 至 0.31 美元(约 27 至 47 日元)。中等规模部署中,向量存储的月费约为 50 至 200 美元(约 7500 至 3 万日元),整体月费约为 2200 至 3400 美元(约 33 万至 51 万日元),P95 延迟的目标是控制在 2.5 秒以内。加入检索验证后,每次查询的延迟会增加 2 至 3 秒,但事实一致性有所提升。结合语义缓存,高重复负载下可降低 20 至 35% 的成本;结合智能路由,混合负载的成本可降低 30 至 45%,延迟可降低 25 至 40%——这是当前业界的普遍认知。
第3章 框架/编排层 —— LangChain、LlamaIndex、CrewAI,以及微软
Agentic RAG应用层实现框架的竞争,于2025年秋迎来了一个关键节点。LangChain于2025年10月20至21日完成了由IVP领投的B轮融资,融资额达1.25亿美元,以12.5亿美元的投后估值正式跻身独角兽行列。参与方包括CapitalG、Sapphire Ventures,战略投资方有ServiceNow Ventures、Workday Ventures、Cisco Investments、Datadog Ventures、Databricks Ventures,老股东Sequoia、Benchmark、Amplify亦跟进追加投资。正如Harrison Chase在Sequoia Capital播客《Context Engineering Our Way to Long-Horizon Agents》中所述:"从三年前的简单RAG链,到基于LangGraph的复杂流程,再到Agent Harness,最优实现方式已经发生了翻天覆地的变化。"为应对这一趋势,LangChain构建了三层产品矩阵——LangChain(基础框架)、LangGraph(图式编排)和LangSmith(观测与评估),并在本轮B轮融资的同时正式发布了LangChain+LangGraph 1.0。据《财富》杂志报道,LangChain公关方面表示,当前ARR"实际低于12至16百万美元这一区间,与我们目前的体量并不相符",这暗示其真实增长速度正在加速至与IVP所定12.5亿美元估值相匹配的水平。Cisco、Replit、Clay、Cloudflare、Workday、ServiceNow等现有客户名单的出现,也印证了观测与评估付费层正有效地成为企业采购的切入点。
LlamaIndex于2025年3月4日完成了由Norwest Venture Partners领投的A轮融资,金额为1900万美元(Greylock参与,累计融资额2750万美元),同时LlamaCloud正式GA上线。创始人Jerry Liu在CEO博客中宣称:"LlamaIndex已不再只是一个RAG框架,而是成为了Agentic Document Processing(智能体文档处理)的基础设施。"公司将业务定位从大而全的抽象框架收窄至"长期可用的最佳文档基础设施"。LlamaCloud已集成LlamaParse(文档解析)、AgentWorkflow(面向非结构化数据的多智能体知识协作)等功能,超过90家Fortune 500企业在内的逾万家机构已进入候补名单。GitHub Stars 47K、月下载量520万(2026年3月数据)的成绩,证明了聚焦文档处理的差异化定位与框架领域头部选手LangChain形成了有效共存。Jerry Liu在2026年初的Newsletter中观察到:"编程智能体(Claude Code、Cursor)正以文件系统为核心向内收敛,智能体仅需5至10个核心工具加上文件系统访问即可运行",这一判断暗示了类Agent Composer轻量工具集设计方向的未来走势。
专注多智能体角色分工的CrewAI于2024年10月完成了由Insight Partners和boldstart ventures领投的1800万美元融资。据Latka于2025年7月确认,其ARR为320万美元,但平台上过去12个月内执行的智能体任务数已突破20亿次,并公开披露Fortune 500中超过60%的企业为其客户。产品架构采用基于角色、目标与任务的智能体协作框架,即将"营销研究员""分析师""写作者"等角色按人类组织方式分配并协同工作,抽象层次高于LangGraph,实现代码更为简洁。公司已将企业云版本正式GA上线,并着重强调跨AWS/GCP/Azure多云部署能力及LLM供应商无关性。
由德国deepset主导的开源框架Haystack,最新一轮主要融资为2023年8月由Balderton Capital领投的3000万美元B轮,2025年12月将产品线重品牌为Haystack Enterprise Platform。产品具备可视化流水线编辑器、模板及私有化部署能力,维护着以Airbus、The Economist、NVIDIA、Comcast为代表的偏欧洲风格大型企业客户群,并在制造业和国防行业中确立了满足本地部署需求的优选地位。
微软将AutoGen与Semantic Kernel整合,于2026年4月正式发布Microsoft Agent Framework 1.0生产版本(2025年10月进入公开预览,翌年4月正式发布)。该框架融合了AutoGen的智能体抽象与Semantic Kernel的企业级能力(会话状态、类型安全、中间件、遥测),具备基于图的工作流编排、多供应商模型支持,以及A2A与MCP跨运行时互操作性。AutoGen此后仅进行维护性更新,新用户将被引导迁移至Agent Framework。微软的整合实质上成为Azure企业用户的事实标准Harness,并与LangChain的商业模式形成了正面竞争。
2025年,开源工作流构建器领域相继发生多起大规模整合。来自中国的Dify在HSG(高瓴)领投下完成3000万美元Pre-A轮融资,以超过13.1万GitHub Stars、包含马士基和诺华在内的280家企业客户,成为该赛道最后一个独立玩家。与此同时,Flowise于2025年8月被Workday收购,Langflow也于同年早些时候被DataStax(现为IBM旗下)收购。a16z和Sequoia反复指出的"品类赢家面临被收购风险阶段"的典型演进,已在工作流构建器层面成为现实。
第4章 向量数据库/检索基础层 —— Pinecone、Weaviate、Qdrant、Chroma、Turbopuffer
要使Agentic RAG真正高效运转,向量搜索的底层架构也需要经历重大演进。2025年至2026年间,这一领域的动向已成为硅谷最重要的基础设施投资主题之一。
Pinecone作为事实上的品类王者,于2023年4月以7.5亿美元(约合人民币54亿元)的估值完成了由a16z领投的1亿美元融资,一度处于巅峰地位,但随后在开源项目和超大规模云厂商的追赶下,于2025年发生了重大变化。创始人Edo Liberty于2025年9月从CEO职位退任,转任首席科学家,专注于"面向下一代智能体型AI系统的研究"。接任CEO一职的是曾任Google全球销售总监、并在AppDynamics和Actifio担任高管的Ash Ashutosh。Liberty常挂在嘴边的一句话是:"未来五年,向量数据库将从一种技术工具转变为企业的长期记忆。"他们正在瞄准智能体长期记忆提供商这一新定位。2025年10月,The Information报道称Pinecone正联合投行探讨出售事宜,预期估价超过20亿美元,潜在买家包括Oracle、IBM、MongoDB和Snowflake。Latka的数据显示,截至2025年12月,Pinecone的营收约为1400万美元,客户数量约4000家,相对于C轮融资时的估值,ARR倍数明显增长乏力。产品层面,Pinecone推出了面向智能体构建的API产品Pinecone Assistant,推进了无服务器架构的改造,同时也开始提供MCP服务器。
Weaviate自Index Ventures领投、Battery Ventures、NEA、Cortical、Zetta及ING Ventures参与的5000万美元B轮融资(2023年4月)以来,截至2026年4月尚未宣布新一轮融资,但在此期间产品侧实现了加速突破。2025年3月,Weaviate完成了Weaviate Agents的全栈发布,同年9月将Query Agent正式推向GA。Query Agent的内部架构颇为有趣——接收用户查询后,它会执行多集合路由,并在单次工具调用中完成查询扩展与分解、过滤器生成及重排序。这是一种"通过单一API提供Agentic RAG"的战略性抽象,其设计理念也使得LangGraph等外部编排器不再是必需品。2026年2月,Weaviate公开了名为Weaviate Agent Skills的开源代码库,使Claude Code、Cursor、GitHub Copilot、VS Code、Gemini CLI等编程智能体能够生成针对Weaviate优化的代码。CEO Bob van Luijt表示:"向量数据库、向量嵌入服务与智能体架构的崛起,是数据管理与数据转换演进历程中的一个重要转折点。"2026年1月,Weaviate获得GigaOm"领导者+超越者"以及Gartner"新兴领导者"的双重认可。
总部位于柏林的Qdrant于2026年3月12日完成了由AVP(Advance Venture Partners)领投的5000万美元B轮融资,Bosch Ventures、Unusual Ventures、Spark Capital及42CAP参与其中,累计融资总额达约8780万美元。公司拥有Tripadvisor、HubSpot、OpenTable、Bazaarvoice、Bosch等标杆客户,下载量超2.5亿次,GitHub Star数达2.9万。基于Rust实现的高性能,以及"可组合向量搜索"的定位——支持在云端、本地或混合环境中部署——使其与欧洲保守型企业客户尤为契合。
Chroma于2025年10月14日完成由Quiet Capital的Astasia Myers主导的B轮融资,以约7500万美元的估值融资1800万美元。其设计将向量、全文、正则表达式及元数据检索统一于单一的开发者体验之中,本地优先的轻量化嵌入方式深受独立RAG开发者及智能体应用原型构建者的青睐。
Milvus/Zilliz自2022年8月完成6000万美元B-II轮融资以来,虽未再进行大规模融资,但在产品层面仍保持着最大的开源心智份额——GitHub Star突破4万,在NVIDIA、Salesforce、eBay、Airbnb、DoorDash等超过1万家企业中落地生产环境,尤其在亚洲市场具有举足轻重的影响力。
新兴阵营中,Turbopuffer的崛起尤为值得关注。该公司由前Shopify工程师Simon Helarep Eskildsen与Justin Lee联合创立,总部位于渥太华,于2025年12月19日完成了由Lachy Groom、Thrive Capital及多位天使投资人参与的种子轮融资(融资金额未披露)。公司以Anthropic、Atlassian、Cursor、Notion为客户,提供以S3/GCS/Azure Blob等对象存储为一等公民的无服务器向量数据库。其采用基于centroid优化的SPFresh索引,在超大规模场景下的每GB成本方面远超竞争对手。在硅谷语境下,"Anthropic、Cursor、Notion等一线AI基础设施需求方已率先采用"这一事实本身,就已构成最有力的行业基准。LanceDB也于2025年6月24日完成了由Theory Ventures领投的3000万美元A轮融资,确立了其在Lance列式格式之上构建"AI原生多模态数据湖仓"的市场定位。
从工程师视角俯瞰这一领域,向量数据库正在分化为三个子品类:第一类是托管无服务器型(Pinecone),目前正在寻求出售;第二类是开源优先+托管云型(Weaviate、Qdrant、Chroma、Milvus);第三类是对象存储驱动型(Turbopuffer、LanceDB)。Pinecone寻求出售的动向,被普遍解读为整个品类正式进入"被超大规模云厂商与开源方案双向夹击"阶段的信号。
第5章 端到端/情境化系平台 —— Contextual AI、Cohere、Vectara
Contextual AI是将Agentic RAG作为"一体化设计的单一系统"而非"各独立组件的拼凑"来提供的最具代表性的企业。创始人Douwe Kiela是2020年Meta RAG论文的第一作者,同时兼任斯坦福大学讲师。Contextual AI继2023年6月完成2000万美元(约30亿日元)种子轮融资后,于2024年8月实现了由Greycroft、Bain Capital Ventures、Lightspeed及Lip-Bu Tan等领投的8000万美元(约120亿日元)A轮融资,总融资额达1亿美元(约150亿日元)。2025年1月正式GA的Contextual AI Platform基于所谓RAG 2.0的设计理念,不再将检索器、重排序器与生成模型(Grounded Language Model)分别训练后拼接,而是对三者进行端到端的联合优化训练。据VentureBeat报道,Contextual GLM在FACTS基准测试中实现了88%的事实一致性,超越Claude 3.5 Sonnet(79.4%)和GPT-4o(78.8%)。在最新的前沿RAG基准测试中录得71.2%,超过最强基线(Cohere + Claude 3.5)的66.8%。公司已获得汇丰银行、高通等财富500强客户,并于2026年1月推出了将企业级RAG转化为生产就绪智能体的Agent Composer。然而,CB Insights数据显示其年收入规模仅约1760万英镑,估值仍在1.5亿美元(约225亿日元)左右。"技术上遥遥领先,但ARR尚未跟上"——这便是Contextual AI当前的处境,下一轮融资的估值水平备受关注。
Cohere是由《Attention Is All You Need》共同作者Aidan Gomez担任CEO的加拿大多伦多企业,作为企业级LLM的先行者实现了快速增长。2025年8月完成由Radical Ventures/Inovia Capital领投的5亿美元(约750亿日元)融资,估值达68亿美元(约1万200亿日元);同年9月追加1亿美元(约150亿日元)的第二次交割,估值进一步提升至70亿美元(约1万500亿日元),AMD、NVIDIA、Salesforce Ventures及HOOPP参与其中。总融资额超16亿美元(约2400亿日元)。2025年ARR达2亿4000万美元(约360亿日元),超额完成原定2亿美元目标;公司延揽具有IPO经验的François Chadwick出任CFO,被视为2026年IPO的有力候选。主力产品包括:拥有1110亿参数、256K上下文窗口的旗舰模型Command A(2025年3月发布,相比Command R+ 08-2024吞吐量提升150%,可在A100/H100×2张卡上运行)、专为企业推理设计的Command A Reasoning(2025年8月)、支持4K上下文且可对100余种语言进行重排序的Rerank 3.5,以及面向企业的智能体基础平台"North"。Cohere于2025年5月收购Ottogrid(前身为Cognosys),将研究型智能体功能整合至North。最大的差异化优势在于三点:"主权AI"、"多语言支持"与"VPC/私有化部署",这一组合对监管严格的金融及公共部门,以及有多语言需求的欧洲、日本企业市场极具吸引力。
Vectara在种子轮融资2850万美元(约42亿7500万日元),并于2024年7月完成由FPV Ventures与Race Capital领投、Samsung Next和Fusion Fund参与的2500万美元(约37亿5000万日元)A轮融资,总融资规模约5350万至7350万美元。公司拥有专为降低幻觉而设计的LLM Mockingbird,是一家垂直整合型RAG API提供商,专注于在受监管行业的落地应用。2025年以来未宣布新一轮融资,持续巩固其作为精简型实施平台的市场定位。
第6章 垂直专业化的Agentic RAG —— Harvey、Hebbia、Sierra、Decagon、Glean
与水平平台层并行,专注特定领域的"垂直型Agentic RAG"在2025年至2026年间吸引了最大规模的资本。追踪各公司的商业模式与融资历程,VC的投资重点一目了然。
专注法律领域的Harvey继2024年D轮融资之后,于2025年6月以50亿美元(约750亿人民币)估值完成由Kleiner Perkins与Coatue联合领投的3亿美元(约45亿人民币)E轮融资;2025年12月以80亿美元(约1200亿人民币)估值完成a16z领投的1.6亿美元(约24亿人民币)融资;2026年3月25日以110亿美元(约1650亿人民币)估值完成由GIC与Sequoia联合领投(Sequoia第三次参与)的2亿美元(约30亿人民币)融资。累计融资总额突破10亿美元(约150亿人民币)。Harvey截至2026年1月的ARR已达1.9亿美元(约28.5亿人民币),较2025年8月的1亿美元(约15亿人民币)在半年内增长1.9倍。客户覆盖AmLaw 100中的过半数律所、500余家企业内部法务团队、50家资产管理公司,业务遍及60个国家。Sequoia在2026年3月的轮次中再度印证了"Agentic AI垂直用例的可防御性",Harvey已成为2026年垂直Agentic RAG领域最重要的标杆企业。
专注金融与法律深度工作的Hebbia,于2024年4月至7月间完成由a16z领投、Index Ventures、GV、Peter Thiel、Eric Schmidt、Jerry Yang等参与的1.3亿美元(约19.5亿人民币)B轮融资,估值达7亿美元(约105亿人民币)。彼时ARR约为1300万美元(约1.95亿人民币),对应54倍估值乘数。客户覆盖全球顶级资产管理公司的三分之一,合计管理规模达14万亿美元(约210万亿人民币)。核心产品Matrix采用电子表格网格UI,以原生方式呈现多智能体的检索、落地与核验流程,于2025年6月完成重新设计,同月收购FlowDocs以内置幻灯片生成功能(目前每日生成超1万份幻灯片)。Hebbia是最忠实践行a16z"以AI智能体替代深度工作"理论的企业。
由Bret Taylor(OpenAI董事长、前Salesforce联席CEO)与Clay Bavor(前Alphabet高管)联合创立的Sierra,继2024年10月以4.5亿美元估值完成1.75亿美元(约26.25亿人民币)融资后,于2025年9月4日以100亿美元(约1500亿人民币)估值完成由Greenoaks Capital领投的3.5亿美元(约52.5亿人民币)融资,累计融资总额达6.35亿美元(约95.25亿人民币)。ARR于2025年11月达到1亿美元(约15亿人民币),创下创业第七季度的纪录,并在成立三年内将年营收运行率推至1.5亿美元(约22.5亿人民币)。客户涵盖数百家大型企业,其中逾20%年营收超百亿美元。Sierra以客户服务为核心,其优势在于为品牌提供可将业务权限委托给智能体至"实际执行操作"层级(如退款处理、工单创建)的校验工具,而Bret Taylor品牌效应所带来的信任度,是其突出的差异化优势。
Decagon于2025年6月以15亿美元(约225亿人民币)估值完成由Accel与a16z联合领投的1.31亿美元(约19.65亿人民币)融资,仅七个月后的2026年1月28日,又以45亿美元(约675亿人民币)估值完成由Coatue与Index Ventures联合领投的2.5亿美元(约37.5亿人民币)融资。估值在半年多时间内增长三倍,其将产品重新定位为高接触客户服务AI"AI Concierge"的战略初见成效。2025年内已签约逾100家新企业客户,D轮融资参与方包括Bain Capital Ventures、BOND、Ribbit、Forerunner、Avra、A*、ChemistryVC、Definition Capital及Starwood Capital。
将企业搜索拓展至Agentic AI领域的Glean,继2024年9月完成2.6亿美元(约39亿人民币)E轮融资(估值46亿美元,约690亿人民币)后,于2025年6月10日以72亿美元(约1080亿人民币)估值完成由Wellington Management领投的1.5亿美元(约22.5亿人民币)F轮融资。新进投资方包括Khosla Ventures、Bicycle Capital、Geodesic Capital及Archerman,现有投资方Altimeter、Capital One Ventures、Citi、Coatue、DST、General Catalyst、ICONIQ、IVP、Kleiner Perkins、Latitude、Lightspeed、Sapphire及Sequoia均追加投资。Glean整合了权限感知型企业SaaS连接器、Glean Agents及工作助手,已成为Reid Hoffman所言"智能体增幅(agent amplification)"的代表案例,在硅谷核心圈层中被广泛引用。
同属垂直赛道的Writer.com于2024年11月12日以19亿美元(约285亿人民币)估值完成由Premji Invest、Radical Ventures与ICONIQ Growth联合领投的2亿美元(约30亿人民币)融资,Adobe Ventures、B Capital、Citi Ventures、IBM Ventures、Salesforce Ventures及Workday Ventures参与其中。该公司将自研大模型Palmyra系列与图谱型RAG、安全护栏及无代码智能体构建器相结合,面向医疗健康、零售及金融服务行业提供垂直化解决方案。
企业级LMS/知识管理平台Sana AI于2025年9月16日以11亿美元(约165亿人民币)被Workday收购,成为该领域2025年规模最大的智能体并购案例。同样,workflow builder平台Flowwise也被Workday收购,Langflow则被DataStax(现已并入IBM)纳入麾下,垂直SaaS厂商在企业内部嵌入Agentic RAG的进程正在快速推进。
第7章 MCP与生态系统标准化 —— 为什么Anthropic将MCP捐赠给Linux基金会
在Agentic RAG的讨论中,2025年最重大的架构事件是Model Context Protocol(MCP)的行业标准化。Anthropic于2024年11月公开MCP时,它不过是一家公司的开放规范,但2025年3月OpenAI在Agents SDK、Responses API及ChatGPT desktop中宣布采用,同年4月Google DeepMind也相继跟进。截至2026年3月,Python/TypeScript SDK的月下载量已达9700万次,公开的MCP服务器超过1万个。2025年11月25日,规范进行了重大更新,涵盖async操作、无状态性、服务器标识及社区驱动注册表等内容;2025年12月,Anthropic将MCP捐赠给Linux Foundation旗下的Agentic AI Foundation(AAIF)。AAIF由Anthropic、Block、OpenAI联合创立,Google、Microsoft、AWS、Cloudflare、Bloomberg提供支持。
随着MCP的标准化,Agentic RAG的竞争轴线已从"使用哪个向量数据库"转变为"使用哪个框架/控制层"。Pinecone提供MCP服务器,Weaviate Agent Skills通过MCP与编码代理进行交互,Anthropic自身也借助MCP实现了对数千个数据源的访问,LangChain与Microsoft Agent Framework均宣称原生支持MCP。由此,数据源侧的连接器价值迅速商品化,价值重心转向编排与数据治理。Forrester预测,30%的企业应用供应商将在2026年底前发布MCP服务器。
与之形成竞争态势的是OpenAI的Responses API,其策略是将托管工具原语(file_search、web_search、function calling)收归OpenAI内部。Responses API的file_search定价为每1000次查询2.5美元,存储费用为每GB每天0.10美元,新建的向量存储最多支持1亿个文件(2025年11月扩展后从1万提升至1亿)。Assistants API将于2026年8月26日停用,功能并入Responses API。工程师面临的选择十分清晰:是加入"OpenAI/Microsoft等封闭生态系统",还是"基于MCP+LangChain/LangGraph/Agent Framework构建自有控制层"——这是一个关乎基础设施自主权的分岔路口。Harrison Chase在《Your harness, your memory》中写道"选择闭源,便意味着失去对自身数据的控制权",正是针对这一分歧所发出的声音。
第8章 硅谷风险投资的资本配置与报道基调
2025年VC投资总体来看,AI相关融资总额从2024年的1140亿美元(约17.1万亿日元)飙升75%,突破2020亿美元(约30.3万亿日元),占全部VC投资的约一半。在独角兽级别交易中,主导交易数量最多的是Sequoia(51笔/21家独角兽)和a16z(50笔/20家)这对双子星,Greylock、Benchmark、Kleiner Perkins、IVP、Index Ventures、Accel、Lightspeed、Coatue、Insight Partners、General Catalyst紧随其后,深度参与Agentic RAG技术栈。a16z公开表示,在2025~26年间累计组建了逾150亿美元(约2.25万亿日元)的基金,单独撬动了美国VC投资额的18%。Sequoia与SoftBank、Google Ventures并肩,于2026年4月宣布规模70亿美元(约1.05万亿日元)的新基金,声称将进一步扩大AI投资。
阅读各家VC公开发布的思想文件,可以清晰看到他们对Agentic RAG的关注视角。a16z在2026年1月发布的《Big Ideas 2026》中将"AI数据转型层"列为基础性创业类别,指出RAG系统面临"因信息源相互矛盾或过时而产生的幻觉,以及Agent工作流以精细而高昂的代价崩溃"等问题,并论证数据质量才是真正的瓶颈。Sequoia在《2026: This is AGI》中宣称"长期视野的Agent在功能上已是AGI,而2026年将是那一年",在《AI in 2026: A Tale of Two AIs》中则强调从副驾驶向自主Agent的转变。Bessemer Venture Partners在《AI Infrastructure Roadmap: Five frontiers for 2026》中分析称"推理工作负载在算力需求和经济重要性上已与训练旗鼓相当,在许多情况下甚至超越训练",并明确表示正在密切关注TensorMesh(LMCache)、RadixArk(SGLang路由)、Inferact(vLLM)等专注Agent的基础设施。
各媒体的报道基调也呈现出一定的趋同。TechCrunch在2025年10月21日的《Open-source agentic startup LangChain hits $1.25B valuation》中详细报道了LangChain的情况;在2026年3月25日的《Harvey confirms $11B valuation, Sequoia triples down》中强调了Sequoia对垂直Agentic RAG的坚定信念;在2026年4月16日的《New leaders, new fund: Sequoia has raised $7B to expand its AI bets》中追踪了Sequoia的资本承诺。The Information率先报道了Pinecone出售传闻,Bloomberg于2026年1月28日在《AI customer support startup Decagon valued at $4.5 billion》中传递了垂直Agent的急速增长。CNBC在2025年6月10日的《Glean raises $150M at $7.2 billion valuation》中追踪了Agent向大型企业的渗透。Fortune在2025年10月20日的独家采访中披露了LangChain的ARR情况,VentureBeat则多次引用Contextual AI的基准测试结果。
纵观2025~2026年VC资本配置,可以看到明显的分化。框架层(LangChain、LlamaIndex、CrewAI)获得了数亿美元量级的资本注入,但估值仍停留在十亿美元一两位数规模。向量数据库层(Pinecone、Qdrant、Chroma)持续获得5000万~1亿美元规模的融资,但类别王者Pinecone已在考虑出售,开始显现出被开源方案与超大规模云厂商夹击的压力。与此形成鲜明对比的是,垂直Agentic RAG(Harvey、Sierra、Decagon、Hebbia、Glean、Cohere)单笔即可连续完成数亿至十亿美元级别的融资,估值也攀升至45亿~110亿美元。从ARR与估值的倍数对比来看,垂直侧的资本效率明显更高。这正是VC们在OpenAI、Anthropic、Google DeepMind垄断平台侧知识优势的背景下,判断"在基础模型之上全面承接业务的垂直Agent"将获得最大经济价值的有力佐证。
批判性声音也在同期涌现。Gartner在2025年6月25日的新闻稿中警告称"超过40%的Agent型AI项目将在2027年底前被取消",并将治理缺失和可观测性不足列为主因。麦肯锡2025年秋季发布的《State of AI 2025》报告指出,超过80%的企业尚未感受到生成式AI对营收的实质贡献,成功将AI Agent在单项功能上规模化落地的组织不足10%。SaaStr的Jason Lemkin在2025年的《SaaS Vibe Check》中反复强调"赢家既是建设者,也是故事讲述者",同时警告"没有观测与评估机制的生产环境AI Agent是定时炸弹"。Anthropic多Agent评估所揭示的"标准对话15倍token消耗"这一事实,作为成本问题的缩影,被反复援引。
第9章 2026年下半年至2027年预测的新动向
综合多家风险投资机构、分析师及智库的预测,未来12至18个月内可观察到的动向轮廓已相对清晰。
其一,长期记忆与智能体框架(Agent Harness)的标准化竞争全面提速。 LangChain Deep Agents、Microsoft Agent Framework 1.0、OpenAI Responses API、Anthropic Claude+MCP、Databricks Genie Code这五大主流框架,将在2026年下半年至2027年间争夺"智能体操作系统"的宝座。最终胜负或许还需数年方能揭晓,但MCP捐赠给Linux Foundation一事,至少已使连接器层实现了中立化。2026年5月13至14日在旧金山召开的LangChain大会(Harrison Chase、Jensen Huang、Andrew Ng出席),将成为开放系框架阵营凝聚共识的重要场合。
其二,垂直领域Agentic RAG的行业类别领导者格局逐步确立。 Harvey(法务)、Hebbia(金融)、Sierra(客户服务)、Decagon(客户服务/AI礼宾)、Glean(企业搜索)、Writer(内容)、Harvey的潜在竞争者Spellbook、EvenUp(保险及人身伤害)、Norm Ai(合规)等,各行业中"提到Agentic RAG就想到这家"的单一寡头化趋势正在推进。Sequoia、a16z、Coatue、Index Ventures预计将在此阶段持续追加投资,将其推向IPO水准。Cohere是最有力的IPO候选,目标窗口为2026年第二至第三季度。
其三,向量数据库层的整合重组提速。 若Pinecone完成收购,Oracle、IBM、Snowflake、MongoDB中的某一方将纳入该类别领导者,与开源系的Weaviate、Qdrant、Milvus之间的生态分野也将更为清晰。与此同时,若由对象存储驱动的Turbopuffer和LanceDB深度整合进阿里云、AWS、Azure的原生服务,"向量数据库独立类别"本身或将面临瓦解。Edo Liberty所描绘的"向量数据库成为企业级长期记忆"愿景能否落地,最迟到2027年将见分晓。
其四,评估与可观测性基础设施迎来爆发式增长。 LangSmith、Arize、Galileo、TruEra、Ragas、Phoenix、Braintrust等评估与观测平台,在2025至2026年间已持续完成数千万美元级别的融资。正如Gartner"40%项目将被叫停"的警告所揭示的,智能体型项目成败的关键,归根结底在于"能否观察生产环境中的行为、能否以数字化方式管控质量"。预计2026年下半年起,AI可观测性将作为独立类别形成完整生态。
其五,日本企业加速进军企业级Agentic RAG市场。 据多方报道,乐天、NTT Data、富士通、NEC、KDDI、软银、Mercari、LINE雅虎等大型IT及电信企业将相继发布面向法人的Agentic RAG产品。此外,NTT的tsuzumi、富士通的Takane、NEC的cotomi等国产大模型与Cohere、Claude等海外模型组合而成的混合架构,预计将成为主流。随着政府采购中主权AI要求的逐步落地,Cohere等以"主权AI"为旗帜的厂商在日本市场的存在感有望显著提升。
其六,智能体间互操作协议(Agent-to-Agent,A2A)成为下一个标准化战场。 Microsoft Agent Framework已将A2A+MCP的跨运行时互操作列为核心目标,其他厂商亦纷纷跟进,AAIF(Agentic AI Foundation)有望主导该领域通用规范的制定。一旦智能体将任务委托给另一智能体的机制得到标准化,Agentic RAG将从"单一智能体检索"演进为"智能体生态系统协同检索"。Singh et al.综述论文中所描述的"多智能体协作"阶段,在实现层面真正落地,有望于2027年前后实现。
第10章 结语 —— Agentic RAG:从"检索工具"到"智能基础设施"
截至2026年4月,硅谷风险投资资本所揭示的事实是:RAG这一概念已超越"检索工具"的范畴,演化为企业级智能基础设施本身。Pinecone创始人Edo Liberty所言"向量数据库将转型为企业的长期记忆"的预言,Databricks联合创始人、2026年ACM Computing奖得主Matei Zaharia所观察到的"AGI已然在此,只是尚未以我们所评估的形式存在",Harrison Chase所主张的"执行框架与记忆系统应当保持开放"的理念,以及Douwe Kiela所践行的"将检索与生成整合为单一系统的RAG 2.0"的工程雄心——这些思想的交汇之处,正在崛起一个名为Agentic RAG的现在进行时的基础设施层。
硅谷的风险投资机构将Agentic RAG视为决定企业软件未来十年走向的构造性变革,而非AI的一个子议题。IVP以125亿美元估值投资LangChain,Sequoia三度押注Harvey,a16z领投Hebbia与Decagon的增长,Coatue持续押注垂直智能体,Greycroft/Bain/Lightspeed支撑Contextual AI的RAG 2.0,Wellington Management作为传统资产管理公司入局Glean——这种多层次的资本配置模式表明,Agentic RAG是一个横跨"基础设施投资"、"企业应用投资"与"生产力投资"三大领域的、射程极为宽广的主题。
另一方面,Gartner预测的"40%项目取消率"、Anthropic报告的"15倍Token消耗"、麦肯锡指出的"不足10%的规模化落地率",也暗示泡沫与预期的调整阶段难以避免。从2026年下半年至2027年,Agentic RAG将从"随处可用的魔法"这一期待,走向成熟——成为"具备明确ROI与可观测性、深度嵌入业务流程的基础设施"。在此过程中,赢家与输家将泾渭分明。硅谷工程师当下真正需要审视的,并非某个特定框架或向量数据库的选型本身,而是一个更为根本的架构判断:"在哪一层控制平面之上承载企业的长期记忆?"待到2027年回望Agentic RAG之时,我们将把它铭记为"AI应用设计思想从流水线范式向流程范式迁移的历史转折点"。
第10章 结语 —— Agentic RAG:从"检索工具"到"智能基础设施"
截至2026年4月,硅谷风险投资资本所揭示的事实是:RAG这一概念已经超越了"检索工具"的范畴,进化为企业级知识基础设施本身。Pinecone创始人Edo Liberty所预言的"向量数据库将转型为企业的长期记忆",Databricks联合创始人、2026年ACM计算奖得主Matei Zaharia所观察到的"AGI已经存在,只是尚未以我们所评估的形式呈现",Harrison Chase所主张的"harness与记忆应当保持开放"的理念,以及Douwe Kiela所践行的"将检索与生成整合为单一系统的RAG 2.0"的工程抱负——这些思想的交汇之处,正在崛起一个名为Agentic RAG的现在进行时的基础设施层。
硅谷的风险投资机构将Agentic RAG视为决定企业软件下一个十年的构造性变革,而非AI的一个子议题。IVP对LangChain给出12.5亿美元的估值,Sequoia三度投资Harvey,a16z领投Hebbia与Decagon的成长,Coatue持续押注垂直领域智能体,Greycroft、Bain、Lightspeed支持Contextual AI的RAG 2.0,Wellington Management作为传统资产管理公司入局Glean——这种多层次的资本配置模式表明,Agentic RAG是一个横跨"基础设施投资"、"企业应用投资"与"生产力投资"三大领域的、射程极为宽广的主题。
另一方面,Gartner预测的"40%取消率"、Anthropic报告的"15倍token消耗"、麦肯锡指出的"规模化落地不足10%"等现实,也暗示着泡沫与预期的调整阶段难以避免。从2026年下半年到2027年,Agentic RAG将从"随处可用的魔法"这一期待,走向"具备明确ROI与可观测性、深度嵌入业务流程的基础设施"的成熟阶段。在这一过程中,胜者与败者将泾渭分明。硅谷工程师当下应当关注的,不是某个特定框架或向量数据库的选型本身,而是"在哪个控制层之上承载自身的长期记忆"这一更为根本的架构判断。当我们在2027年回望Agentic RAG时,将会把它铭记为"AI应用的设计理念从流水线式向流程式转型的历史转折点"。
来源
- Singh, Ehtesham, Kumar, Khoei, Vasilakos,"Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG"(arXiv:2501.09136)— https://arxiv.org/abs/2501.09136
- Asai 等,"Self-RAG: Learning to Retrieve, Generate, and Critique through Self-Reflection"(arXiv:2310.11511)— https://arxiv.org/abs/2310.11511
- Yan 等,"Corrective Retrieval Augmented Generation"(arXiv:2401.15884)— https://arxiv.org/abs/2401.15884
- Jeong, Baek, Cho, Hwang, Park,"Adaptive-RAG"(arXiv:2403.14403)— https://arxiv.org/abs/2403.14403
- Yao 等,"ReAct: Synergizing Reasoning and Acting in Language Models"(arXiv:2210.03629)— https://arxiv.org/abs/2210.03629
- Edge 等,微软研究院,"From Local to Global: A Graph RAG Approach to Query-Focused Summarization"(arXiv:2404.16130)— https://arxiv.org/abs/2404.16130
- 微软研究院,"LazyGraphRAG: Setting a new standard for quality and cost" — https://www.microsoft.com/en-us/research/blog/lazygraphrag-setting-a-new-standard-for-quality-and-cost/
- 微软研究院,GraphRAG 项目 — https://www.microsoft.com/en-us/research/project/graphrag/
- 微软研究院,"BenchmarkQED: Automated benchmarking of RAG systems" — https://www.microsoft.com/en-us/research/blog/benchmarkqed-automated-benchmarking-of-rag-systems/
- Anthropic 工程团队,"How we built our multi-agent research system" — https://www.anthropic.com/engineering/multi-agent-research-system
- Anthropic,"Introducing Contextual Retrieval" — https://www.anthropic.com/news/contextual-retrieval
- Anthropic,"Introducing the Model Context Protocol" — https://www.anthropic.com/news/model-context-protocol
- Anthropic,"Donating the Model Context Protocol and establishing the Agentic AI Foundation" — https://www.anthropic.com/news/donating-the-model-context-protocol-and-establishing-of-the-agentic-ai-foundation
- 模型上下文协议规范 2025-11-25 — https://modelcontextprotocol.io/specification/2025-11-25
- NVIDIA 开发者博客,"Traditional RAG vs Agentic RAG — Why AI Agents Need Dynamic Knowledge to Get Smarter" — https://developer.nvidia.com/blog/traditional-rag-vs-agentic-rag-why-ai-agents-need-dynamic-knowledge-to-get-smarter/
- NVIDIA AI Blueprints,RAG 参考实现 — https://github.com/NVIDIA-AI-Blueprints/rag
- Cohere,"Rerank" — https://cohere.com/rerank
- Cohere 文档,"Command A" — https://docs.cohere.com/docs/command-a
- BAAI,"BGE Reranker v2-m3" — https://huggingface.co/BAAI/bge-reranker-v2-m3
- Khattab 与 Zaharia,"ColBERT"(arXiv:2004.12832)— https://arxiv.org/abs/2004.12832
- OpenAI,"New Tools for Building Agents" — https://openai.com/index/new-tools-for-building-agents/
- OpenAI,"New tools and features in the Responses API" — https://openai.com/index/new-tools-and-features-in-the-responses-api/
- OpenAI 开发者,"Responses API tool orchestration" — https://developers.openai.com/cookbook/examples/responses_api/responses_api_tool_orchestration
- OpenAI 平台文档,"Deep Research Guide" — https://platform.openai.com/docs/guides/deep-research
- Andreessen Horowitz,"Big Ideas 2026(第一部分)" — https://a16z.com/newsletter/big-ideas-2026-part-1/
- Andreessen Horowitz,"The Rise of Computer Use and Agentic Coworkers" — https://a16z.com/the-rise-of-computer-use-and-agentic-coworkers/
- Andreessen Horowitz,"Vector Databases and the Power of RAG" — https://a16z.com/podcast/vector-databases-and-the-power-of-rag/
- Andreessen Horowitz,"Investing in Hebbia" — https://a16z.com/announcement/investing-in-hebbia/
- Sequoia Capital,"2026: This is AGI" — https://sequoiacap.com/article/2026-this-is-agi/
- Sequoia Capital,"AI in 2026: A Tale of Two AIs" — https://sequoiacap.com/article/ai-in-2026-the-tale-of-two-ais/
- Sequoia Capital 播客,"Context Engineering Our Way to Long-Horizon Agents"(Harrison Chase)— https://sequoiacap.com/podcast/context-engineering-our-way-to-long-horizon-agents-langchains-harrison-chase/
- Sequoia Capital,"LangChain: From Agent 0 to 1 to Agentic Engineering" — https://sequoiacap.com/article/langchain-from-agent-0-to-1-to-agentic-engineering/
- Bessemer Venture Partners,"AI Infrastructure Roadmap: Five frontiers for 2026" — https://www.bvp.com/atlas/ai-infrastructure-roadmap-five-frontiers-for-2026
- Bessemer Venture Partners,"Securing AI Agents" — https://www.bvp.com/atlas/securing-ai-agents-the-defining-cybersecurity-challenge-of-2026
- Gartner 新闻稿,"到 2026 年 40% 的企业应用将具备特定任务 AI 代理" — https://www.gartner.com/en/newsroom/press-releases/2025-08-26-gartner-predicts-40-percent-of-enterprise-apps-will-feature-task-specific-ai-agents-by-2026-up-from-less-than-5-percent-in-2025
- Gartner 新闻稿,"超过 40% 的 Agentic AI 项目将在 2027 年底前被取消" — https://www.gartner.com/en/newsroom/press-releases/2025-06-25-gartner-predicts-over-40-percent-of-agentic-ai-projects-will-be-canceled-by-end-of-2027
- Gartner,具备 Agentic AI 的供应链管理软件 530 亿美元预测 — https://www.gartner.com/en/newsroom/press-releases/2026-04-07-gartner-forecasts-supply-chain-management-software-with-agentic-ai-will-grow-to-53-billion-in-spend-by-2030
- 麦肯锡,"2026 年 AI 信任状况:迈向 Agentic 时代" — https://www.mckinsey.com/capabilities/tech-and-ai/our-insights/tech-forward/state-of-ai-trust-in-2026-shifting-to-the-agentic-era
- 麦肯锡,"Seizing the Agentic AI Advantage" — https://www.mckinsey.com/capabilities/quantumblack/our-insights/seizing-the-agentic-ai-advantage
- 麦肯锡,"The State of AI 2025: Agents, Innovation" — https://www.mckinsey.com/~/media/mckinsey/business%20functions/quantumblack/our%20insights/the%20state%20of%20ai/november%202025/the-state-of-ai-2025-agents-innovation_cmyk-v1.pdf
- MarketsandMarkets,RAG 市场报告 — https://www.marketsandmarkets.com/PressReleases/retrieval-augmented-generation-rag.asp
- MarketsandMarkets,向量数据库市场 — https://www.marketsandmarkets.com/Market-Reports/vector-database-market-112683895.html
- Grand View Research,RAG 市场 — https://www.grandviewresearch.com/industry-analysis/retrieval-augmented-generation-rag-market-report
- Fortune Business Insights,Agentic AI 市场 — https://www.fortunebusinessinsights.com/agentic-ai-market-114233
- LangChain 博客,"B 轮融资公告" — https://blog.langchain.com/series-b/
- TechCrunch,"开源 Agentic 初创公司 LangChain 估值达 12.5 亿美元" — https://techcrunch.com/2025/10/21/open-source-agentic-startup-langchain-hits-1-25b-valuation/
- Fortune,"早期 AI 明星 LangChain 成为独角兽" — https://fortune.com/2025/10/20/exclusive-early-ai-darling-langchain-is-now-a-unicorn-with-a-fresh-125-million-in-funding/
- LangChain 博客,"Your harness, your memory" — https://www.langchain.com/blog/your-harness-your-memory
- LangChain 博客,NVIDIA 企业合作伙伴关系 — https://blog.langchain.com/nvidia-enterprise/
- LangChain 通讯,2026 年 3 月 — https://www.langchain.com/blog/march-2026-langchain-newsletter
- TechCrunch,"LlamaIndex 推出用于构建非结构化数据代理的云服务" — https://techcrunch.com/2025/03/04/llamaindex-launches-a-cloud-service-for-building-unstructed-data-agents/
- LlamaIndex 博客,"A 轮融资及 LlamaCloud 正式发布" — https://www.llamaindex.ai/blog/announcing-our-series-a-and-llamacloud-general-availability
- LlamaIndex 博客,"LlamaIndex 不仅仅是一个 RAG 框架" — https://www.llamaindex.ai/blog/llamaindex-is-more-than-a-rag-framework
- PRNewswire,"LlamaIndex 完成 1900 万美元 A 轮融资" — https://www.prnewswire.com/news-releases/llamaindex-secures-19-million-series-a-to-power-enterprise-grade-knowledge-agents-302390936.html
- Norwest Venture Partners,"LlamaIndex" — https://www.norwest.com/blog/llamaindex-harnesses-the-power-of-enterprise-data-for-ai-agent-workflows/
- Pulse2,"CrewAI 多智能体平台完成 1800 万美元 A 轮融资" — https://pulse2.com/crewai-multi-agent-platform-raises-18-million-series-a/
- Insight Partners,"CrewAI ScaleUp AI 故事" — https://www.insightpartners.com/ideas/crewai-scaleup-ai-story/
- Enterprise AI World,CrewAI 1800 万美元融资 — https://www.enterpriseaiworld.com/Articles/News/News/$18M-in-Funding-Catapults-CrewAIs-Multi-Agentic-Platform-to-the-Enterprise-Level-166495.aspx
- deepset,"Balderton Capital 融资公告" — https://www.deepset.ai/news/funding-announcement-balderton-capital
- deepset,"Introducing Haystack Enterprise Platform" — https://www.deepset.ai/blog/introducing-haystack-enterprise-platform
- Visual Studio Magazine,"微软发布可用于生产的 Agent Framework 1.0" — https://visualstudiomagazine.com/articles/2026/04/06/microsoft-ships-production-ready-agent-framework-1-0-for-net-and-python.aspx
- Microsoft Learn,"Agent Framework 概述" — https://learn.microsoft.com/en-us/agent-framework/overview/
- Visual Studio Magazine,"Semantic Kernel + AutoGen 开源微软 Agent Framework" — https://visualstudiomagazine.com/articles/2025/10/01/semantic-kernel-autogen--open-source-microsoft-agent-framework.aspx
- Dify — https://dify.ai/
- Pinecone 博客,"B 轮融资" — https://www.pinecone.io/blog/series-b/
- TechCrunch,"Pinecone 以 7.5 亿美元估值完成 1 亿美元投资" — https://techcrunch.com/2023/04/27/pinecone-drops-100m-investment-on-750m-valuation-as-vector-database-demand-grows/
- VentureBeat,"Pinecone 创始人 Edo Liberty 任命谷歌人 Ash 担任 CEO" — https://venturebeat.com/data-infrastructure/pinecone-founder-edo-liberty-appoints-googler-ash-as-ceo
- PRNewswire,Pinecone CEO 交接 — https://www.prnewswire.com/news-releases/pinecone-founder-edo-liberty-to-spearhead-pinecones-growing-ai-ambitions-appoints-ash-ashutosh-as-ceo-to-expand-vector-database-market-leadership-302549334.html
- Calcalist Tech,Pinecone 出售猜测 — https://www.calcalistech.com/ctechnews/article/rz31q82b5
- TechTarget SearchDataManagement,Pinecone 展望未来 — https://www.techtarget.com/searchdatamanagement/news/366631366/Vector-database-vendor-Pinecone-eyes-future-under-new-CEO
- Pinecone 博客,"Pinecone Assistant 正式发布" — https://www.pinecone.io/blog/pinecone-assistant-generally-available/
- Weaviate,"Weaviate B 轮融资" — https://www.prnewswire.com/news-releases/weaviate-raises-50-million-series-b-funding-to-meet-soaring-demand-for-ai-native-vector-database-technology-301803296.html
- Weaviate,Weaviate 走向全栈 — https://www.globenewswire.com/news-release/2025/03/04/3036570/0/en/Weaviate-Goes-Full-Stack-With-Launch-of-Weaviate-Agents-for-AI-Development.html
- Weaviate 博客,Query Agent — https://weaviate.io/blog/query-agent
- Weaviate 博客,2025 年度回顾 — https://weaviate.io/blog/weaviate-in-2025
- Weaviate,Agent Skills 发布 — https://www.globenewswire.com/news-release/2026/02/21/3242244/0/en/Weaviate-Launches-Agent-Skills-to-Empower-AI-Coding-Agents.html
- Weaviate,GigaOm 领导者 / Gartner 新兴领导者认可 — https://www.globenewswire.com/news-release/2026/01/14/3218396/0/en/Weaviate-named-a-Leader-and-Outperformer-by-GigaOm-and-Emerging-Leader-by-Gartner-Market-Momentum-Accelerates-as-Nonrelational-DBMS-Segment-Grows-22-7.html
- TechCrunch,"Qdrant 开源向量数据库" — https://techcrunch.com/2024/01/23/qdrant-open-source-vector-database/
- Qdrant 博客,"A 轮融资" — https://qdrant.tech/blog/series-a-funding-round/
- BusinessWire,"Qdrant 完成 5000 万美元 B 轮融资" — https://www.businesswire.com/news/home/20260312313902/en/Qdrant-Raises-$50-Million-Series-B-to-Define-Composable-Vector-Search-as-Core-Infrastructure-for-Production-AI
- Chroma 公司,"种子轮" — https://www.trychroma.com/company/seed
- Medium,"我们对 Chroma 的投资(Astasia Myers)" — https://medium.com/memory-leak/our-investment-in-chroma-the-developer-centric-embedding-database-34277ac327e8
- Salestools,Chroma B 轮融资报告 — https://salestools.io/en/report/chroma-raises-18m-series-b
- TechCrunch,"Zilliz 迁往旧金山,完成 6000 万美元融资" — https://techcrunch.com/2022/08/24/zilliz-the-startup-behind-the-milvus-open-source-vector-database-for-ai-applications-raises-60m-and-relocates-to-sf/
- Yahoo Finance,"Milvus GitHub 星标突破 40000" — https://finance.yahoo.com/news/milvus-surpasses-40-000-github-010000562.html
- TechCrunch,Vespa 分拆 — https://techcrunch.com/2023/10/04/yahoo-spins-out-vespa-its-search-tech-into-an-independent-company/
- Vespa.ai,Blossom Capital 融资 — https://vespa.ai/2023-11-01-blossom-funding/
- Tracxn,LanceDB 简介 — https://tracxn.com/d/companies/lancedb/__ie1HuEEUoPOIc3tEX5yowY9yMJz9kdNTH01mwCePxLw
- BetaKit,Turbopuffer 完成新一轮融资 — https://betakit.com/ex-shopify-engineers-raise-fresh-financing-to-scale-turbopuffers-ai-search/
- Turbopuffer,关于 — https://turbopuffer.com/about
- SiliconANGLE,Contextual AI 获 8000 万美元用于 RAG 2.0 — https://siliconangle.com/2024/08/02/contextual-ai-nabs-80m-rag-2-0-platform/
- Contextual AI 博客,平台正式发布 — https://contextual.ai/blog/platform-ga-press-release
- Contextual AI 研究,RAG 2.0 介绍 — https://contextual.ai/research/introducing-rag2
- VentureBeat,Contextual AI 优于 GPT-4o — https://venturebeat.com/ai/contextual-ais-new-ai-model-crushes-gpt-4o-in-accuracy-heres-why-it-matters
- VentureBeat,Contextual AI Agent Composer — https://venturebeat.com/technology/contextual-ai-launches-agent-composer-to-turn-enterprise-rag-into-production
- Morningstar PRNewswire,Agent Composer 发布 — https://www.morningstar.com/news/pr-newswire/20260127sf71236/contextual-ai-launches-agent-composerai-for-when-it-actually-is-rocket-science
- TechCrunch,"Cohere 估值达 70 亿美元,与 AMD 建立合作" — https://techcrunch.com/2025/09/24/cohere-hits-7b-valuation-a-month-after-its-last-raise-partners-with-amd/
- PSP Investments / Cohere 融资公告 — https://www.investpsp.com/en/news/fresh-funding-enables-cohere-to-accelerate-its-global-expansion-and-build-the-next-generation-of-secure-enterprise-and-sovereign-ai-solutions/
- Futurum Group,"Cohere 多语言主权 AI 护城河——迈向 2026 年 IPO" — https://futurumgroup.com/insights/coheres-multilingual-sovereign-ai-moat-ahead-of-a-2026-ipo/
- InfoWorld,"Cohere 北上布局 Agentic AI" — https://www.infoworld.com/article/3757962/cohere-goes-north-with-agentic-ai.html
- Vectara A 轮融资,BusinessWire — https://www.businesswire.com/news/home/20240716489550/en/Vectara-Secures-%2425-Million-Series-A-Funding-to-Advance-the-Trustworthiness-of-Retrieval-Augmented-Generation-with-New-Mockingbird-LLM
- Glean,F 轮 1.5 亿美元融资 — https://www.glean.com/press/glean-raises-150m-series-f-at-7-2b-valuation-to-accelerate-enterprise-ai-agent-innovation-globally
- TechCrunch,Glean 估值 72 亿美元 — https://techcrunch.com/2025/06/10/enterprise-ai-startup-glean-lands-a-7-2b-valuation/
- CNBC,Glean 1.5 亿美元 F 轮融资 — https://www.cnbc.com/2025/06/10/glean-gen-ai-search-startup-raises-150-million-at-7-billion-value.html
- TechCrunch,Perplexity 以 200 亿美元估值完成 2 亿美元融资 — https://techcrunch.com/2025/09/10/perplexity-reportedly-raised-200m-at-20b-valuation/
- Writer.com,C 轮融资公告 — https://writer.com/blog/series-c-funding-writer-press-release/
- TechCrunch,Writer 以 19 亿美元估值完成 2 亿美元融资 — https://techcrunch.com/2024/11/12/generative-ai-startup-writer-raises-200m-at-a-1-9b-valuation/
- TechCrunch,Hebbia 1.3 亿美元 B 轮融资 — https://techcrunch.com/2024/07/09/ai-startup-hebbia-rased-130m-at-a-700m-valuation-on-13-million-of-profitable-revenue/
- Hebbia 博客,B 轮融资 — https://www.hebbia.com/blog/hebbia-raises-usd130m-series-b
- TechCrunch,Harvey 估值 110 亿美元 — https://techcrunch.com/2026/03/25/harvey-confirms-11b-valuation-sequoia-triples-down/
- CNBC,Harvey 以 110 亿美元估值完成 2 亿美元融资 — https://www.cnbc.com/2026/03/25/legal-ai-startup-harvey-raises-200-million-at-11-billion-valuation.html
- Harvey,融资系列公告 — https://www.harvey.ai/blog/harvey-raises-at-dollar11-billion-valuation-to-scale-agents-across-law-firms-and-enterprises
- TechCrunch,Harvey 2025 年 12 月估值 80 亿美元 — https://techcrunch.com/2025/12/04/legal-ai-startup-harvey-confirms-8b-valuation/
- TechCrunch,Bret Taylor 的 Sierra 以 100 亿美元估值完成 3.5 亿美元融资 — https://techcrunch.com/2025/09/04/bret-taylors-sierra-raises-350m-at-a-10b-valuation/
- TechCrunch,Sierra ARR 突破 1 亿美元 — https://techcrunch.com/2025/11/21/bret-taylors-sierra-reaches-100m-arr-in-under-two-years/
- CNBC,Sierra 估值 100 亿美元 — https://www.cnbc.com/2025/09/04/bret-taylor-sierra-ai-startup-salesforce-openai.html
- Decagon 博客,D 轮融资公告 — https://decagon.ai/blog/series-d-announcement
- Bloomberg,Decagon 估值 45 亿美元 — https://www.bloomberg.com/news/articles/2026-01-28/ai-customer-support-startup-decagon-valued-at-4-5-billion
- Decagon 博客,C 轮融资 — https://decagon.ai/resources/series-c-announcement
- BusinessWire,Decagon D 轮融资 — https://www.businesswire.com/news/home/20260128580542/en/Decagons-Valuation-Triples-to-$4.5-Billion-as-it-Ushers-in-the-Age-of-AI-Concierge
- Sana Labs,B 轮融资公告 — https://sanalabs.com/resources/announcing-sanas-series-b-round
- Sana Labs,B 轮融资追加 — https://sanalabs.com/resources/sana-reaches-62m-dollars-in-series-b-funding
- You.com,C 轮融资公告 — https://you.com/resources/series-c
- TechStartups,You.com 以 15 亿美元估值完成 1 亿美元 C 轮融资 — https://techstartups.com/2025/09/04/you-com-raises-100m-series-c-in-funding-at-1-5b-valuation-to-scale-ai-search-infrastructure/
- TechCrunch,Databricks 以 1340 亿美元估值完成 40 亿美元融资 — https://techcrunch.com/2025/12/16/databricks-raises-4b-at-134b-valuation-as-its-ai-business-heats-up/
- Databricks,MosaicML 收购 — https://www.databricks.com/company/newsroom/press-releases/databricks-completes-acquisition-mosaicml
- Databricks 博客,Genie Code — https://www.databricks.com/blog/introducing-genie-code
- Databricks,Agent Bricks 发布 — https://www.databricks.com/company/newsroom/press-releases/databricks-launches-agent-bricks-new-approach-building-ai-agents
- TechCrunch,Matei Zaharia 荣获 ACM 计算奖 — https://techcrunch.com/2026/04/08/databricks-matei-zaharia-wins-acm-computing-prize-agi/
- TechCrunch,Sequoia 为 AI 募资 70 亿美元 — https://techcrunch.com/2026/04/16/new-leaders-new-fund-sequoia-has-raised-7b-to-expand-its-ai-bets/
- Snowflake 发布说明,Cortex Agents 正式发布 — https://docs.snowflake.com/en/release-notes/2025/other/2025-11-04-cortex-agents
- Snowflake,Cortex 概述 — https://www.snowflake.com/en/product/features/cortex/
- Snowflake,Cortex Code — https://www.snowflake.com/en/product/features/cortex-code/
- SaaStr,"2025 年 SaaS 现状检验(Jason Lemkin)" — https://www.saastr.com/the-2025-saas-vibe-check-what-founders-need-to-know-right-now-with-saastr-ceo-and-founder-jason-lemkin/
- Jahanzaib.ai,"Agentic RAG 生产指南" — https://www.jahanzaib.ai/blog/agentic-rag-production-guide
- Suprmind,"AI 幻觉率与基准测试" — https://suprmind.ai/hub/ai-hallucination-rates-and-benchmarks/