Bab 1 Mengapa RAG Kini "Terpaksa" Menjadi "Agentic"

Kertas kerja tahun 2020 bertajuk *Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks* yang diterbitkan di arXiv oleh Douwe Kiela dan rakan-rakannya semasa berada di Facebook AI Research merupakan asal usul istilah RAG yang digunakan pada masa kini. Prosedur yang dikemukakan dalam kertas kerja tersebut kemudiannya dikenali sebagai "Naive RAG" — sebuah saluran paip yang ringkas: mengubah pertanyaan kepada embedding, mendapatkan semula k serpihan terdekat dalam ruang vektor, kemudian menyisipkannya sebagai konteks kepada LLM. Selepas kemunculan ChatGPT pada penghujung tahun 2022, Naive RAG ini tersebar luas dengan kelajuan setara Bugatti, namun antara tahun 2023 hingga 2024, tiga halangan utama mula terserlah dalam persekitaran pelaksanaan peringkat enterprise.

Pertama, reka bentuk yang cuba mewakili semua pertanyaan dalam satu ruang embedding tunggal terbukti lemah secara struktural apabila berhadapan dengan pertanyaan panjang yang mengandungi niat bercampur, atau soalan yang memerlukan penaakulan berbilang langkah. Kedua, carian vektor memang mahir memulangkan dokumen yang "serupa secara semantik", tetapi tidak dapat menjamin dokumen yang "tepat secara fakta terhadap pertanyaan". Ketiga, data korporat bukan sahaja tersebar dalam dokumen tidak berstruktur, malah turut merangkumi jadual SQL, graf pengetahuan, API, dan acara masa nyata — menjadikan pendekatan menyumbat semua data ke dalam satu pangkalan data vektor sesuatu yang tidak praktikal.

Dalam dunia akademik antara tahun 2023 hingga 2024, kertas-kertas kerja yang bertujuan merobohkan batasan ini muncul secara berturut-turut. Self-RAG oleh Asai et al. (arXiv:2310.11511, Oktober 2023) memperkenalkan mekanisme *reflection token* di mana LLM sendiri menentukan "sama ada perlu mendapatkan semula" dan "sama ada hasil yang didapatkan adalah munasabah", membuka laluan bagi model membuat keputusan secara dinamik tentang perlu atau tidaknya melakukan carian. CRAG (*Corrective RAG*, arXiv:2401.15884) yang diterbitkan oleh Yan et al. pada Januari 2024 memperlihatkan reka bentuk di mana penilai carian ringan mengembalikan skor keyakinan, dan apabila keyakinan rendah, carian web diaktifkan sebagai pengembangan luaran. Adaptive-RAG (arXiv:2403.14403, diterima NAACL 2024) yang diterbitkan oleh Jeong et al. pada Mac 2024 mencadangkan susun atur tiga peringkat: model bahasa berskala kecil ditempatkan di hadapan untuk mengklasifikasikan kerumitan pertanyaan, di mana pertanyaan mudah diarahkan tanpa carian, pertanyaan sederhana diarahkan ke carian sekali, dan pertanyaan kompleks diarahkan ke carian berulang. Kertas-kertas kerja ini dibangunkan di atas reka bentuk asas pola ReAct (Yao et al., arXiv:2210.03629, ICLR 2023) yang "menggabungkan penaakulan dan tindakan secara berselang-seli", dan menjelang awal tahun 2025, ia telah membentuk piawaian industri yang diakui secara meluas.

Aliran ini kemudiannya disistematisasikan oleh Singh, Ehtesham, Kumar, Khoei, Vasilakos dan rakan-rakan dalam *A Survey of Agentic Retrieval-Augmented Generation for Large Language Models* (arXiv:2501.09136) pada Januari 2025, yang menyusun evolusi RAG kepada empat generasi: "Naive RAG → Advanced RAG → Modular RAG → Agentic RAG". Kertas kerja yang sama mendefinisikan bahawa "Agentic RAG menguruskan strategi carian secara dinamik dan menyaring pemahaman konteks secara berulang dengan menanamkan corak reka bentuk seperti refleksi (*reflection*), perancangan (*planning*), penggunaan alat (*tool use*), dan penyelarasan berbilang ejen."

Jika dirumuskan dari perspektif jurutera Silicon Valley, Naive RAG adalah "panggilan fungsi", manakala Agentic RAG adalah "pelaksanaan proses". Yang pertama adalah saluran paip satu arah dari pertanyaan kepada jawapan, manakala yang kedua memiliki keadaan dan gelung, mampu melakukan percubaan semula, penghalaan, dan panggilan alat mengikut keperluan — lebih menyerupai proses OS. Blog kejuruteraan Anthropic bertajuk *How we built our multi-agent research system* yang diterbitkan pada Jun 2025 melaporkan bahawa konfigurasi jenis orkestrator-pekerja dengan Claude Opus 4 sebagai pemimpin dan Claude Sonnet 4 sebagai sub-ejen mengatasi Claude Opus 4 tunggal sebanyak 90.2% dalam penilaian dalaman, memberikan bukti kuantitatif tentang kelebihan konfigurasi berbilang ejen. Pada masa yang sama, laporan itu juga terus terang mendedahkan bahawa "berbilang ejen menggunakan kira-kira 15 kali lebih banyak token berbanding sembang standard" dan "penggunaan token menjelaskan 80% varians prestasi dalam penilaian penyemakan imbas" — prestasi ini hanya boleh dicapai dengan pertukaran kos yang signifikan.

Data pasaran turut menyokong peralihan ini. Gartner dalam siaran akhbar bertarikh 26 Ogos 2025 meramalkan bahawa nisbah aplikasi yang dilengkapi ejen AI khusus tugas, yang kurang daripada 5% pada tahun 2025, akan melonjak kepada 40% menjelang akhir tahun 2026. Pada tahun 2028, dijangkakan 33% perisian enterprise akan menyepadukan AI berasaskan ejen, dan 70% aplikasi AI akan menggunakan pendekatan berbilang ejen. Menurut laporan MarketsandMarkets, pasaran RAG sahaja dijangka berkembang daripada USD 1.94 bilion (kira-kira ¥291 bilion) pada tahun 2025 kepada USD 9.86 bilion (kira-kira ¥1.479 trilion) pada tahun 2030 dengan CAGR 38.4%, manakala anggaran Grand View Research mencatatkan CAGR 49.1% menuju USD 11 bilion (kira-kira ¥1.65 trilion) pada tahun 2030. Pasaran pangkalan data vektor pula diramal oleh MarketsandMarkets berkembang daripada USD 2.65 bilion (kira-kira ¥397.5 bilion) pada tahun 2025 kepada USD 8.95 bilion (kira-kira ¥1.3425 trilion) pada tahun 2030 dengan CAGR 27.5%, sementara Fortune Business Insights meramalkan keseluruhan pasaran AI berasaskan ejen akan mengembang secara eksplosif daripada USD 9.14 bilion (kira-kira ¥1.371 trilion) pada tahun 2026 kepada USD 139.19 bilion (kira-kira ¥20.8785 trilion) pada tahun 2034 dengan CAGR 40.5%. Angka-angka ini telah mengangkat Agentic RAG daripada "eksperimen makmal AI segelintir pihak" kepada "pasaran infrastruktur bernilai berbelas trilion yen".

Bab 2 Teknologi Teras dan Corak Reka Bentuk Agentic RAG

Jika seorang jurutera mendefinisikan Agentic RAG dalam satu ayat, ia adalah "sistem yang mempunyai gelung yang memanggil pencarian sebagai alat, dan mengemas kini keadaan serta pengambilan keputusan pada setiap gelung." Dalam definisi ini, terdapat sekurang-kurangnya enam elemen teknikal yang bebas.

Elemen pertama ialah penghalauan pertanyaan (query routing), penulisan semula pertanyaan (rewriting), penguraian pertanyaan (decomposition), dan HyDE (Hypothetical Document Embedding). Penghalauan bermaksud tindakan agen yang menerima pertanyaan pengguna untuk menentukan sama ada ia perlu dihantar ke pangkalan data vektor, ditukar kepada pertanyaan SQL, dihantar ke carian Web, atau diterjemahkan kepada pertanyaan Cypher untuk graf pengetahuan. Penulisan semula ialah proses menukar ungkapan percakapan pengguna kepada bentuk yang optimum untuk carian, dan selalunya menggunakan LLM berskala kecil. Penguraian ialah proses memecahkan soalan kompleks seperti "bagaimana B berbeza daripada A, dan bagaimana C berkaitan?" kepada beberapa sub-pertanyaan. HyDE ialah kaedah yang dicadangkan oleh Gao et al. (2022), di mana LLM diminta menjana jawapan hipotetikal kepada pertanyaan pengguna, kemudian teks jawapan hipotetikal tersebut di-embed dan digunakan untuk carian, dengan tujuan mengurangkan jurang gaya antara pertanyaan dan dokumen.

Elemen kedua ialah carian hibrid (hybrid search). Dari 2025 hingga 2026, konsensus industri menumpu kepada struktur tiga lapisan iaitu "dense (vektor padat) + sparse (BM25/SPLADE) + reranking." Dense menangkap kesamaan semantik, manakala sparse menangkap kesepadanan leksikal, dan kedua-duanya saling melengkapi kelemahan masing-masing. Pelaksanaan rujukan RAG Blueprint yang diterbitkan oleh NVIDIA di GitHub menyediakan carian hibrid dense+sparse, carian berbilang koleksi, dan pengindeksan/pertanyaan dipercepatkan GPU dengan menukar ElasticSearch dan Milvus secara pluggable, serta menstandaradkan penggabungan melalui Reciprocal Rank Fusion (RRF). "Contextual Retrieval" yang diterbitkan oleh Anthropic pada September 2024 menambah pra-pemprosesan dengan menggunakan Claude untuk menambah teks penerangan konteks sebelum menyematkan chunk, menghasilkan keputusan yang mengejutkan iaitu mengurangkan kadar kegagalan carian teratas 20 sebanyak 35% berbanding embedding mudah, 49% dengan BM25 digabungkan, dan 67% dengan reranking digabungkan, yang serta-merta menulis semula standard pelaksanaan pra-pemprosesan pengindeksan RAG.

Elemen ketiga ialah reranking. Ini adalah proses yang menggunakan cross-encoder yang lebih mahal untuk menyusun semula urutan set calon yang diperoleh melalui carian dense dan sparse. Rerank 3 yang dikeluarkan oleh Cohere pada September 2024 mempunyai panjang konteks 4K, dan syarikat itu mendakwa bahawa "Rerank hanya menghantar dokumen yang paling relevan kepada saluran paip RAG dan aliran kerja agen, mengurangkan penggunaan token, meminimumkan latensi, dan meningkatkan ketepatan." Keluarga BGE Reranker v2 (v2-m3, v2-gemma, v2-minicpm-layerwise) yang diterbitkan oleh BAAI pada Mac 2024 telah menjadi standard kem OSS. ColBERT/ColBERTv2 yang dicadangkan oleh Omar Khattab et al. menggunakan pendekatan berbeza yang dipanggil "late interaction," mencapai kualiti BERT dengan FLOP dua digit lebih rendah dan daya pemprosesan dua digit lebih laju, manakala ColBERTv2 mengurangkan jejak storan sebanyak 6-10 kali.

Elemen keempat ialah refleksi diri (self-reflection) dan pembetulan diri. Reflection token Self-RAG dan pemarkahan keyakinan CRAG terletak dalam silsilah ini. Dari segi pelaksanaan, corak conditional edge yang disediakan oleh LangGraph adalah tipikal, di mana nod yang menentukan "adakah hasil carian mencukupi?" dan "adakah hasil penjanaan konsisten secara faktual?" dimasukkan untuk menjalankan gelung carian secara dinamik. Dalam Adaptive RAG berasaskan LangGraph, dengan menggabungkan selective routing dan validation, beberapa penanda aras pelaksanaan melaporkan pengurangan halusinasi sehingga 78% berbanding RAG statik.

Elemen kelima ialah Graf RAG (GraphRAG). GraphRAG yang diterbitkan oleh Edge et al. dari Microsoft Research dalam arXiv:2404.16130, dan mengeluarkan v2 pada Februari 2025, melakukan pengindeksan dua peringkat: membina graf pengetahuan entiti daripada kumpulan dokumen menggunakan LLM, dan pra-mengira pengesanan komuniti serta ringkasan komuniti. Ini menghasilkan keputusan yang jauh mengatasi RAG vektor tulen dalam pertanyaan jenis "global sensemaking" (trend keseluruhan dan ringkasan menyeluruh) untuk korpus berskala satu juta token, dalam kedua-dua aspek komprehensiviti dan kepelbagaian. Lebih jauh, LazyGraphRAG yang diumumkan pada November 2024 mencapai keseimbangan kos/kualiti dengan mengurangkan kos pengindeksan setara dengan RAG vektor (0.1% daripada GraphRAG penuh), mengurangkan kos pertanyaan kepada 1/700 daripada GraphRAG Global Search sambil mencapai kualiti jawapan yang setara, dan pada masa yang sama mengatasi GraphRAG dalam kedua-dua jenis pertanyaan global dan lokal dengan 4% kos pertanyaan. LazyGraphRAG telah diintegrasikan ke dalam Microsoft Discovery dan Azure Local pada 2025, dan juga digunakan dalam produk sebenar.

Elemen keenam ialah memori jangka panjang dan pengurusan keadaan. Esei "Your harness, your memory" yang diterbitkan oleh Harrison Chase pada April 2026 menyatakan dengan jelas idea pemisahan antara memori jangka pendek agen (mesej dalam perbualan dan hasil panggilan alat yang besar) dan memori jangka panjang (ingatan merentasi sesi), serta pendekatan memindahkan pengurusan memori ke sisi agen harness. Beliau telah melaksanakan "memori kerja berasaskan sistem fail," "pendedahan kemahiran berperingkat," dan "keselamatan berlapis" dalam LangChain Deep Agents, dan dengan keras memperjuangkan sumber terbuka lapisan memori dengan menyatakan bahawa "memilih sumber tertutup bermakna anda kehilangan kawalan ke atas data anda sendiri." Ini bertentangan tajam dengan strategi API Responses OpenAI (diumumkan Mac 2025) yang memasukkan primitif alat yang dihoskan (file_search, web_search, function calling), dan membentuk titik percabangan ideologi yang menjadi topik utama perbincangan AI agen pada 2026.

Kos pelaksanaan yang mengintegrasikan enam elemen ini sama sekali tidak ringan dalam persekitaran pengeluaran 2026. Menurut panduan pengeluaran yang diterbitkan oleh perunding bebas Jahanzaib pada awal 2026, harga setiap pertanyaan untuk pengambilan semula standard ialah USD 0.06–0.09 (kira-kira 9–14 sen ringgit mengikut kadar semasa), tetapi untuk Agentic RAG multi-hop yang kompleks, harga ini melonjak kepada USD 0.18–0.31 (kira-kira 27–47 sen). Bagi penggunaan berskala sederhana, stor vektor adalah USD 50–200 (kira-kira RM 230–920) sebulan, dengan jumlah keseluruhan sekitar USD 2,200–3,400 (kira-kira RM 10,100–15,600) sebulan, dan matlamatnya ialah mengekalkan latensi P95 dalam masa 2.5 saat. Menambah pengesahan carian meningkatkan latensi sebanyak 2–3 saat setiap pertanyaan, tetapi meningkatkan konsistensi faktual. Penggunaan caching semantik dapat mengurangkan kos sebanyak 20–35% untuk beban kerja berulang tinggi, manakala penggunaan penghalauan pintar dapat mengurangkan kos 30–45% dan latensi 25–40% untuk beban kerja campuran — itulah gambaran keadaan sebenar di lapangan.

Bab 3 Lapisan Rangka Kerja / Orkestrasi ―― LangChain, LlamaIndex, CrewAI, dan Microsoft

Persaingan rangka kerja untuk melaksanakan lapisan aplikasi Agentic RAG mencapai salah satu titik penentuan pada musim luruh 2025. LangChain berjaya mengumpul 125 juta dolar AS (kira-kira 18.75 bilion yen) dalam Siri B yang dipimpin oleh IVP pada 20-21 Oktober 2025, menjadi syarikat bertaraf unicorn dengan penilaian pasca-wang sebanyak 1.25 bilion dolar AS (kira-kira 187.5 bilion yen). Pelabur yang turut serta termasuk CapitalG, Sapphire Ventures, dan sebagai pelabur strategik: ServiceNow Ventures, Workday Ventures, Cisco Investments, Datadog Ventures, dan Databricks Ventures, manakala pelabur sedia ada Sequoia, Benchmark, dan Amplify turut melabur tambahan. Seperti yang dinyatakan oleh Harrison Chase dalam podcast Sequoia Capital bertajuk "Context Engineering Our Way to Long-Horizon Agents", "Pelaksanaan optimum telah berubah secara dramatik daripada simple RAG chain tiga tahun lalu, melalui aliran kompleks menggunakan LangGraph, hingga ke agent harness." Sebagai respons terhadap perubahan ini, LangChain turut menyusun portfolio produk tiga lapisan — LangChain (rangka kerja asas), LangGraph (orkestrasi berasaskan graf), dan LangSmith (pemerhatian dan penilaian) — serta melancarkan LangChain + LangGraph 1.0 serentak dengan Siri B tersebut. Dalam temubual dengan majalah Fortune, jurucakap LangChain mengulas bahawa ARR semasa adalah "lebih rendah daripada realiti, angka yang tidak sepadan dengan kami sekarang" berbanding laporan yang menyebutkan julat "12 hingga 16 juta dolar AS (kira-kira 1.8 bilion hingga 2.4 bilion yen)", menunjukkan bahawa trajektori pertumbuhan sebenar telah mempercepatkan ke paras yang sejajar dengan penilaian 1.25 bilion dolar AS yang ditetapkan oleh IVP. Senarai pelanggan sedia ada seperti Cisco, Replit, Clay, Cloudflare, Workday, dan ServiceNow juga membuktikan bahawa pelan berbayar bagi pemerhatian dan penilaian berfungsi sebagai tarikan dalam pemerolehan korporat.

LlamaIndex mengumpul 19 juta dolar AS (kira-kira 2.85 bilion yen) dalam Siri A yang dipimpin oleh Norwest Venture Partners pada 4 Mac 2025 (dengan penyertaan Greylock, menjadikan jumlah keseluruhan 27.5 juta dolar AS / kira-kira 4.1 bilion yen), dan pada masa yang sama menjadikan LlamaCloud tersedia secara umum (GA). Pengasas Jerry Liu dalam blog CEOnya mengisytiharkan bahawa "LlamaIndex bukan lagi sekadar rangka kerja RAG, tetapi telah menjadi asas kepada Agentic Document Processing", menyempitkan skop perniagaan daripada sebuah gedung abstraksi serba lengkap kepada "infrastruktur dokumen terbaik yang tahan lama." Malah, LlamaCloud kini dilengkapi dengan fungsi seperti LlamaParse (penghuraian dokumen) dan AgentWorkflow (kerja pengetahuan berbilang ejen untuk data tidak berstruktur), dengan lebih 10,000 organisasi — termasuk lebih 90 syarikat Fortune 500 seperti Salesforce, KPMG, Carlyle, dan Rakuten — berada dalam senarai tunggu. Statistik 47K bintang GitHub dan 5.2 juta muat turun sebulan (setakat Mac 2026) membuktikan bahawa kedudukan sebagai pakar dokumen membolehkan LlamaIndex wujud berdampingan dengan LangChain, yang mendominasi dalam kalangan rangka kerja. Dalam surat berita awal 2026, Jerry Liu turut menyatakan pemerhatian bahawa "ejen pengkodan (Claude Code, Cursor) semakin menumpu kepada sistem fail, dan ejen beroperasi hanya dengan 5 hingga 10 alat teras ditambah akses sistem fail", memberi isyarat kepada hala tuju reka bentuk set alat ringan seperti Agent Composer.

CrewAI, yang memfokuskan sepenuhnya pada pembahagian peranan berbilang ejen, mengumpul 18 juta dolar AS (kira-kira 2.7 bilion yen) dalam pusingan yang dipimpin oleh Insight Partners dan boldstart ventures pada Oktober 2024. ARR yang disahkan oleh Latka pada Julai 2025 ialah 3.2 juta dolar AS (kira-kira 480 juta yen), namun bilangan pelaksanaan ejen yang dijalankan pada platform dalam tempoh 12 bulan lalu telah melepasi 2 bilion kali, dan syarikat mendakwa lebih 60% Fortune 500 adalah pelanggannya. Seni bina produk menggunakan role-based agents with goals and tasks — iaitu rangka kerja di mana peranan seperti "penyelidik pemasaran", "penganalisis", dan "penulis" ditugaskan dan bekerjasama seperti organisasi manusia — yang mempunyai tahap abstraksi lebih tinggi daripada LangGraph dengan kod pelaksanaan yang lebih ringkas. Syarikat telah menjadikan awan korporat tersedia secara umum (GA) dan menekankan keupayaan penggunaan silang awan AWS/GCP/Azure serta ketidakbergantungan kepada vendor LLM.

Haystack, sebuah OSS yang diketuai oleh deepset dari Jerman, menjadikan Siri B sebanyak 30 juta dolar AS (kira-kira 4.5 bilion yen) yang dipimpin oleh Balderton Capital pada Ogos 2023 sebagai kutipan dana utama terkini, dan pada Disember 2025 meletak semula nama barisan produknya sebagai Haystack Enterprise Platform. Platform ini menawarkan editor saluran paip visual, templat, dan penggunaan atas premis, serta mengekalkan asas pelanggan korporat besar yang kuat di Eropah seperti Airbus, The Economist, NVIDIA, dan Comcast. Ia telah mengukuhkan kedudukannya sebagai pilihan yang memenuhi keperluan atas premis dalam industri pembuatan dan pertahanan.

Microsoft telah menyatukan AutoGen dan Semantic Kernel, dan pada April 2026 melancarkan Microsoft Agent Framework 1.0 untuk pengeluaran (pratonton awam pada Oktober 2025, versi rasmi pada April tahun berikutnya). Rangka kerja ini menggabungkan abstraksi ejen AutoGen dengan ciri-ciri korporat Semantic Kernel (keadaan sesi, keselamatan jenis, perisian tengah, telemetri), dan dilengkapi dengan orkestrasi aliran kerja berasaskan graf, sokongan model berbilang pembekal, serta saling kendali silang masa jalan A2A dan MCP. AutoGen selepas ini hanya akan menerima penyelenggaraan sahaja, dengan pengguna baharu diarahkan ke Agent Framework. Penyatuan Microsoft secara praktikalnya menjadi harness standard bagi syarikat yang menggunakan Azure, dan wujud dalam persaingan langsung dengan model perniagaan LangChain.

Dalam arena pembina aliran kerja OSS, siri penggabungan besar berlaku pada 2025. Dify asal China mengumpul pra-A sebanyak 30 juta dolar AS (kira-kira 4.5 bilion yen) yang dipimpin oleh HSG (Hillhouse), kini menjadi kubu kuat terakhir yang bebas dengan lebih 131,000 bintang GitHub dan 280 pelanggan korporat termasuk Maersk dan Novartis. Sebaliknya, Flowise diambil alih oleh Workday pada Ogos 2025, manakala Langflow diambil alih lebih awal pada tahun yang sama oleh DataStax (kini di bawah IBM). Perkembangan tipikal "fasa di mana pemenang kategori terdedah kepada risiko pengambilalihan" yang berulang kali dinyatakan oleh a16z dan Sequoia kini menjadi kenyataan di lapisan pembina aliran kerja.

Bab 4 Lapisan Pangkalan Data Vektor/Carian ―― Pinecone, Weaviate, Qdrant, Chroma, Turbopuffer

Untuk Agentic RAG berfungsi sepenuhnya, evolusi besar-besaran juga diperlukan di sebalik carian vektor. Pergerakan dalam bidang ini dari 2025 hingga 2026 merupakan salah satu tema pelaburan infrastruktur terbesar di Silicon Valley.

Pinecone berada di puncak sebagai raja kategori de facto apabila ia mengumpul $100 juta (kira-kira ¥15 bilion) pada penilaian $750 juta (kira-kira ¥112.5 bilion) dalam pusingan yang dipimpin a16z pada April 2023, namun menghadapi tekanan hebat dari sumber terbuka dan hyperscaler pada 2025. Pengasas Edo Liberty berundur dari jawatan CEO ke Chief Scientist pada September 2025, mengumumkan tumpuannya kepada "penyelidikan untuk sistem AI agentic generasi seterusnya." Pengganti beliau sebagai CEO ialah Ash Ashutosh, bekas Pengarah Jualan Global Google yang juga pernah memegang jawatan eksekutif di AppDynamics dan Actifio. Frasa kegemaran Liberty ialah "Dalam lima tahun akan datang, DB vektor akan beralih daripada alat teknikal kepada memori jangka panjang enterprise," mengincar posisi baharu sebagai pengurus memori jangka panjang ejen. Pada Oktober 2025, The Information melaporkan bahawa Pinecone sedang mempertimbangkan penjualan bersama penasihat perbankan, dengan harga jangkaan melebihi $2 bilion (kira-kira ¥300 bilion), dan nama Oracle, IBM, MongoDB, serta Snowflake disebut sebagai bakal pembeli. Berdasarkan data Latka, hasil Pinecone pada Disember 2025 ialah $14 juta (kira-kira ¥2.1 bilion) dengan bilangan pelanggan sekitar 4,000 syarikat, menunjukkan gandaan ARR berbanding penilaian Siri C yang jelas tidak berkembang. Dari sisi produk, syarikat ini melancarkan Pinecone Assistant sebagai API pembinaan ejen, menjalankan pembaharuan kepada seni bina tanpa pelayan, serta mula menyediakan pelayan MCP.

Weaviate belum mengumumkan sebarang penggalangan dana tambahan secara rasmi setakat April 2026 sejak Siri B $50 juta (kira-kira ¥7.5 bilion) yang dipimpin Index Ventures pada April 2023 (dengan penyertaan Battery Ventures, NEA, Cortical, Zetta, dan ING Ventures), namun dalam tempoh tersebut ia memecut dari sisi produk. Pada Mac 2025, Weaviate melancarkan Weaviate Agents secara penuh, dan pada September tahun yang sama, Query Agent mencapai status GA. Struktur dalaman Query Agent amat menarik — apabila menerima pertanyaan pengguna, ia melaksanakan penghalaan pelbagai koleksi, pengembangan dan penguraian pertanyaan, penjanaan penapis, serta pemeringkatan semula, semuanya dalam satu panggilan alat. Ini merupakan abstraksi strategik "menyampaikan Agentic RAG melalui satu API tunggal," sekaligus merupakan reka bentuk yang menghapuskan keperluan orkestrator luar seperti LangGraph. Pada Februari 2026, Weaviate menerbitkan repositori OSS bernama Weaviate Agent Skills, membolehkan ejen pengekodan seperti Claude Code, Cursor, GitHub Copilot, VS Code, dan Gemini CLI menjana kod yang dioptimumkan untuk Weaviate. CEO Bob van Luijt menyatakan, "Kemunculan DB vektor, perkhidmatan pembenaman vektor, dan seni bina agentic merupakan titik perubahan dalam evolusi pengurusan dan transformasi data," dan pada Januari 2026, syarikat ini dinilai sebagai "Leader + Outperformer" oleh GigaOm dan "Emerging Leader" oleh Gartner.

Qdrant yang berpangkalan di Berlin mengumpul $50 juta (kira-kira ¥7.5 bilion) dalam Siri B yang dipimpin AVP (Advance Venture Partners) pada 12 Mac 2026, dengan penyertaan Bosch Ventures, Unusual Ventures, Spark Capital, dan 42CAP, menjadikan jumlah dana terkumpul sekitar $87.8 juta (kira-kira ¥13.17 bilion). Syarikat ini memiliki kes pelaksanaan dari Tripadvisor, HubSpot, OpenTable, Bazaarvoice, dan Bosch, dengan lebih 250 juta muat turun dan 29,000 bintang GitHub. Kelajuan pelaksanaan yang ditulis dalam Rust, serta penempatan sebagai "carian vektor boleh gubah" yang berfungsi di mana-mana — awan, on-premise, atau hibrid — menjadikannya sesuai untuk syarikat-syarikat Eropah yang konservatif.

Chroma mengumpul $18 juta (kira-kira ¥2.7 bilion) pada penilaian sekitar $75 juta (kira-kira ¥11.25 bilion) dalam Siri B pada 14 Oktober 2025 yang dipimpin Astasia Myers dari Quiet Capital. Reka bentuknya menyediakan carian vektor, teks penuh, ungkapan nalar, dan metadata dalam satu UX pembangun tunggal, dan sifatnya yang ringan untuk penggunaan terbenam yang mengutamakan tempatan mendapat sokongan daripada pembangun RAG indie dan prototaip aplikasi ejen.

Milvus/Zilliz belum melakukan penggalangan besar sejak Siri B-II $60 juta (kira-kira ¥9 bilion) pada Ogos 2022, namun dari sisi produk, ia masih mengekalkan bahagian fikiran OSS terbesar, melepasi 40,000 bintang GitHub dengan lebih 10,000 penggunaan pengeluaran daripada syarikat seperti NVIDIA, Salesforce, eBay, Airbnb, dan DoorDash. Pengaruhnya di pasaran Asia khususnya amat besar.

Dalam kalangan pendatang baharu, kemunculan Turbopuffer menarik perhatian. Syarikat ini ialah sebuah permulaan berpangkalan di Ottawa yang diasaskan bersama oleh jurutera bekas Shopify, Simon Hjerrild Eskildsen dan Justin Lee, dan mengumpul pusingan benih dengan jumlah tidak didedahkan daripada Lachy Groom, Thrive Capital, dan beberapa pelabur individu pada 19 Disember 2025. Syarikat ini mempunyai Anthropic, Atlassian, Cursor, dan Notion sebagai pelanggan, menawarkan DB vektor tanpa pelayan yang menganggap storan objek seperti S3/GCS/Azure Blob sebagai warganegara kelas pertama. Ia menggunakan indeks SPFresh yang dioptimumkan centroid, mengatasi pesaing dalam kos per GB pada skala besar. Dalam konteks Silicon Valley, hakikat bahawa "pengguna infrastruktur AI barisan hadapan seperti Anthropic, Cursor, dan Notion telah menggunakannya" berfungsi sebagai penanda aras tersendiri. LanceDB juga mengumpul $30 juta (kira-kira ¥4.5 bilion) dalam Siri A yang dipimpin Theory Ventures pada 24 Jun 2025, mengukuhkan kedudukannya sebagai "lakehouse multimodal AI-native" di atas format lajur Lance.

Dari perspektif jurutera yang melihat bidang ini secara menyeluruh, DB vektor sedang berpecah kepada tiga subkategori. Pertama, jenis terurus tanpa pelayan (Pinecone) yang sedang meneroka penjualan; kedua, jenis OSS-first + awan terurus (Weaviate, Qdrant, Chroma, Milvus); dan ketiga, jenis dipacu storan objek (Turbopuffer, LanceDB). Penerokaan penjualan Pinecone dibaca sebagai isyarat bahawa keseluruhan kategori ini telah memasuki fasa "diapit oleh hyperscaler dan OSS."

Bab 5 Platform Hujung-ke-Hujung / Jenis Kontekstual ―― Contextual AI, Cohere, Vectara

Pendekatan untuk menyediakan Agentic RAG bukan sebagai "gabungan komponen berasingan" tetapi sebagai "sistem tunggal yang direka bersepadu" paling ketara diwujudkan oleh Contextual AI. Pengasasnya, Douwe Kiela, merupakan pengarang utama makalah RAG Meta tahun 2020 itu sendiri, dan turut berkhidmat sebagai pensyarah sambilan di Stanford. Selepas pelaburan benih sebanyak $20 juta (kira-kira ¥3 bilion) pada Jun 2023, Contextual AI merealisasikan Siri A sebanyak $80 juta (kira-kira ¥12 bilion) pada Ogos 2024 yang dipimpin oleh Greycroft, Bain Capital Ventures, Lightspeed, dan Lip-Bu Tan, mencapai jumlah pembiayaan sebanyak $100 juta (kira-kira ¥15 bilion). Contextual AI Platform yang dilancarkan kepada GA pada Januari 2025 adalah berdasarkan falsafah reka bentuk yang dipanggil RAG 2.0, yang melaksanakan pembelajaran bersama (joint learning) end-to-end yang mengoptimumkan secara bersama retriever, reranker, dan model penjanaan (Grounded Language Model), berbanding melatih dan menghubungkan ketiganya secara berasingan. VentureBeat melaporkan bahawa Contextual GLM mencapai konsistensi fakta 88% pada penanda aras FACTS, mengatasi Claude 3.5 Sonnet (79.4%) dan GPT-4o (78.8%). Pada penanda aras RAG terkini yang paling canggih, ia mencatatkan 71.2%, mengatasi garis dasar terkuat (Cohere + Claude 3.5) sebanyak 66.8%. Syarikat ini telah mendapatkan pelanggan Fortune 500 seperti HSBC dan Qualcomm, dan pada Januari 2026 melancarkan Agent Composer yang menukar RAG perusahaan kepada ejen pengeluaran. Namun, hasil tahunan menurut CB Insights masih berada pada skala £17.6 juta, dengan penilaian masih sekitar $150 juta (kira-kira ¥22.5 bilion). "Unggul jauh dari segi teknikal tetapi ARR belum menyusul" itulah kedudukan semasa Contextual AI, dan tahap pusingan pembiayaan seterusnya menjadi tumpuan perhatian.

Cohere ialah syarikat Kanada berpangkalan di Toronto dengan Aidan Gomez — salah seorang pengarang bersama 'Attention Is All You Need' — sebagai CEO, dan telah berkembang pesat sebagai pemimpin dalam LLM perusahaan. Pada Ogos 2025, syarikat ini mencapai penilaian $6.8 bilion (kira-kira ¥1.02 trilion) melalui pembiayaan $500 juta (kira-kira ¥75 bilion) yang dipimpin oleh Radical Ventures/Inovia Capital, dan seterusnya meningkat kepada penilaian $7 bilion (kira-kira ¥1.05 trilion) melalui penutupan kedua sebanyak $100 juta (kira-kira ¥15 bilion) pada September, dengan penyertaan AMD, NVIDIA, Salesforce Ventures, dan HOOPP. Jumlah pembiayaan melebihi $1.6 bilion (kira-kira ¥240 bilion). ARR 2025 sebanyak $240 juta (kira-kira ¥36 bilion) melepasi sasaran awal $200 juta, syarikat ini telah melantik François Chadwick yang berpengalaman dalam IPO sebagai CFO, dan dilihat sebagai calon IPO terkuat untuk 2026. Produk utama termasuk model unggulan Command A dengan 111B parameter dan konteks 256K (Mac 2025, throughput 150% berbanding Command R+ 08-2024, beroperasi dengan 2×A100/H100), Command A Reasoning yang khusus untuk inferens perusahaan (Ogos 2025), Rerank 3.5 yang mampu meranking semula lebih 100 bahasa dengan konteks 4K, serta "North" sebagai asas ejen untuk perusahaan. Cohere mengakuisisi Ottogrid (dahulu Cognosys) pada Mei 2025 dan mengintegrasikan fungsi ejen penyelidikan ke dalam North. Tiga paksi pembezaan utama ialah AI "berdaulat (sovereign)", "berbilang bahasa", dan "penggunaan VPC/on-premises", mengekalkan konfigurasi yang relevan untuk sektor kewangan dan awam yang dikawal ketat, serta perusahaan Eropah dan Jepun yang memerlukan sokongan berbilang bahasa.

Vectara telah memperoleh $28.5 juta (kira-kira ¥4.275 bilion) dalam pusingan benih, dan $25 juta (kira-kira ¥3.75 bilion) dalam Siri A yang dipimpin oleh FPV Ventures dan Race Capital pada Julai 2024, dengan penyertaan Samsung Next dan Fusion Fund, menjadikan jumlah pembiayaan dalam lingkungan $53.5 juta hingga $73.5 juta. Ia merupakan API RAG terintegrasi secara menegak yang memiliki LLM khusus pengurangan halusinasi bernama Mockingbird, dengan fokus pada penggunaan dalam industri berkawal. Tiada pembiayaan baharu yang diumumkan sejak 2025, dan syarikat ini mengekalkan kedudukannya sebagai platform pelaksanaan berskala kecil.

Bab 6 Agentic RAG Kepakaran Menegak ―― Harvey、Hebbia、Sierra、Decagon、Glean

Selari dengan lapisan platform mendatar, "Agentic RAG Vertikal" yang khusus untuk domain tertentu telah menarik modal terbesar dari tahun 2025 hingga 2026. Dengan menjejaki model perniagaan dan sejarah pembiayaan setiap syarikat, menjadi jelas di mana VC memfokuskan penekanan mereka.

Harvey, yang khusus dalam undang-undang, selepas Siri D pada 2024, telah memperoleh $300 juta (kira-kira ¥45 bilion) dalam Siri E yang dipimpin bersama oleh Kleiner Perkins dan Coatue pada Jun 2025 dengan penilaian $5 bilion (kira-kira ¥750 bilion), kemudian $160 juta (kira-kira ¥24 bilion) dipimpin oleh a16z pada Disember 2025 dengan penilaian $8 bilion (kira-kira ¥1.2 trilion), dan $200 juta (kira-kira ¥30 bilion) yang dipimpin bersama oleh GIC dan Sequoia (penyertaan ketiga Sequoia) pada 25 Mac 2026 dengan penilaian $11 bilion (kira-kira ¥1.65 trilion). Jumlah pembiayaan telah melampaui $1 bilion (kira-kira ¥150 bilion). ARR Harvey pada Januari 2026 telah mencapai $190 juta (kira-kira ¥28.5 bilion), melonjak 1.9 kali ganda dalam separuh tahun daripada $100 juta (kira-kira ¥15 bilion) pada Ogos 2025. Pelanggannya merangkumi majoriti AmLaw 100, lebih 500 pasukan undang-undang dalaman, 50 syarikat pengurusan aset, dan tersebar di 60 negara. Sequoia dalam pusingan Mac 2026 telah mengesahkan semula "kebolehtahanan kes penggunaan vertikal AI Agentic," menjadikan Harvey proksi terpenting Agentic RAG vertikal pada 2026.

Hebbia, yang mendakwa khusus dalam kerja mendalam kewangan dan undang-undang, mencapai penilaian $700 juta (kira-kira ¥105 bilion) dalam Siri B bernilai $130 juta (kira-kira ¥19.5 bilion) yang dipimpin a16z dengan penyertaan Index Ventures, GV, Peter Thiel, Eric Schmidt, dan Jerry Yang dari April hingga Julai 2024. ARR pada masa itu adalah kira-kira $13 juta (kira-kira ¥1.95 bilion) dengan gandaan 54x. Pangkalan pelanggannya merangkumi satu pertiga syarikat pengurusan aset utama dunia, dengan jumlah AUM terkumpul berskala $14 trilion (kira-kira ¥2,100 trilion). Produk utama mereka, Matrix, direka untuk merepresentasikan secara natif pelbagai ejen yang melakukan retrieve, ground, dan verify dalam antara muka UI grid hamparan, direka semula pada Jun 2025, dan pada bulan yang sama mengakuisisi FlashDocs untuk menyatukan fungsi penjanaan slaid (kini melebihi 10,000 penjanaan slaid sehari). Hebbia adalah syarikat yang paling setia mewujudkan tesis a16z tentang "menggantikan kerja mendalam dengan ejen AI."

Sierra, yang diasaskan oleh Bret Taylor (Pengerusi OpenAI, bekas Co-CEO Salesforce) dan Clay Bavor (bekas Alphabet), selepas memperoleh $175 juta (kira-kira ¥26.25 bilion) dengan penilaian $450 juta pada Oktober 2024, memperoleh $350 juta (kira-kira ¥52.5 bilion) yang dipimpin oleh Greenoaks Capital dengan penilaian $10 bilion (kira-kira ¥1.5 trilion) pada 4 September 2025, menjadikan jumlah pembiayaan $635 juta (kira-kira ¥95.25 bilion). ARR mencapai $100 juta (kira-kira ¥15 bilion) pada November 2025, memecahkan rekod dalam 7 suku sejak penubuhannya, dan mencapai kadar larian hasil tahunan $150 juta (kira-kira ¥22.5 bilion) pada tahun ketiga operasi. Pelanggannya adalah ratusan syarikat besar, lebih 20% daripadanya mempunyai hasil melebihi $10 bilion. Sierra memfokuskan pada perkhidmatan pelanggan sambil mengutamakan alat penyuntingan untuk jenama yang boleh mendelegasikan kuasa operasi kepada ejen sehingga peringkat "mengambil tindakan sebenar" seperti pemprosesan bayaran balik dan penerbitan tiket, dengan jenama Bret Taylor membentuk faktor pembezaan yang menonjol.

Decagon memperoleh $131 juta (kira-kira ¥19.65 bilion) yang dipimpin bersama Accel dan a16z dengan penilaian $1.5 bilion (kira-kira ¥225 bilion) pada Jun 2025, dan hanya 7 bulan kemudian pada 28 Januari 2026 memperoleh $250 juta (kira-kira ¥37.5 bilion) yang dipimpin bersama Coatue dan Index Ventures dengan penilaian $4.5 bilion (kira-kira ¥675 bilion). Penilaian melonjak tiga kali ganda dalam lebih separuh tahun, dan strategi mendefinisikan semula diri sebagai AI perkhidmatan pelanggan sentuhan tinggi yang dipanggil "AI Concierge" telah membuahkan hasil. Lebih 100 kontrak perusahaan baharu telah diperoleh sepanjang 2025, dan Pusingan Siri D disertai oleh Bain Capital Ventures, BOND, Ribbit, Forerunner, Avra, A\*, ChemistryVC, Definition Capital, dan Starwood Capital.

Glean, yang mengembangkan carian perusahaan kepada AI Agentic, mengikuti Siri E bernilai $260 juta (kira-kira ¥39 bilion) dengan penilaian $4.6 bilion (kira-kira ¥690 bilion) pada September 2024, dan memperoleh $150 juta (kira-kira ¥22.5 bilion) dalam Siri F yang dipimpin Wellington Management dengan penilaian $7.2 bilion (kira-kira ¥1.08 trilion) pada 10 Jun 2025. Khosla Ventures, Bicycle Capital, Geodesic Capital, dan Archerman menyertai sebagai pelabur baharu, sementara pelabur sedia ada termasuk Altimeter, Capital One Ventures, Citi, Coatue, DST, General Catalyst, ICONIQ, IVP, Kleiner Perkins, Latitude, Lightspeed, Sapphire, dan Sequoia membuat pelaburan tambahan. Glean menyatukan penyambung SaaS perusahaan yang sedar kebenaran, Glean Agents, dan pembantu kerja, menjadi contoh yang kerap disebut di pusat Silicon Valley sebagai wakil "amplifikasi ejen" yang dituturkan oleh Reid Hoffman.

Dalam kategori vertikal yang sama, Writer.com memperoleh $200 juta (kira-kira ¥30 bilion) yang dipimpin bersama Premji Invest, Radical Ventures, dan ICONIQ Growth dengan penilaian $1.9 bilion (kira-kira ¥285 bilion) pada 12 November 2024, dengan penyertaan Adobe Ventures, B Capital, Citi Ventures, IBM Ventures, Salesforce Ventures, dan Workday Ventures. Ia menggabungkan keluarga LLM Palmyra yang dibina sendiri, RAG berasaskan graf, pagar pelindung, dan pembina ejen tanpa kod untuk menyediakan pakej vertikal bagi penjagaan kesihatan, runcit, dan perkhidmatan kewangan.

Sana AI, LMS perusahaan dan pengurusan pengetahuan, telah diakuisisi oleh Workday pada harga $1.1 bilion (kira-kira ¥165 bilion) pada 16 September 2025, direkodkan sebagai salah satu akuisisi ejen terbesar dalam domain ini pada 2025. Begitu juga, pembina aliran kerja Flowise diambil oleh Workday, dan Langflow diambil oleh DataStax (kini IBM), menandakan peningkatan pesat dalam penyatuan Agentic RAG ke dalam perniagaan oleh vendor SaaS vertikal.

Bab 7 MCP dan Piawaian Ekosistem ―― Mengapa Anthropic Menyerahkan MCP kepada Linux Foundation

Insiden seni bina terbesar pada tahun 2025 dalam perbincangan Agentic RAG ialah penstandaran industri Model Context Protocol (MCP). Ketika Anthropic menerbitkan MCP pada November 2024, ia hanyalah spesifikasi terbuka milik satu syarikat, namun pada Mac 2025, OpenAI mengumumkan penerimaannya dalam Agents SDK, Responses API, dan ChatGPT desktop, diikuti oleh Google DeepMind pada April tahun yang sama. Bilangan muat turun bulanan SDK Python/TypeScript mencapai 97 juta setakat Mac 2026, dan pelayan MCP yang tersedia kepada umum telah melebihi 10,000. Pada 25 November 2025, kemas kini spesifikasi yang ketara telah dilakukan merangkumi operasi async, statelessness, pengenalan pelayan, dan pendaftaran dipacu komuniti, dan pada Disember 2025, Anthropic menyerahkan MCP kepada Agentic AI Foundation (AAIF) di bawah Linux Foundation. AAIF diasaskan bersama oleh Anthropic, Block, dan OpenAI, dengan sokongan daripada Google, Microsoft, AWS, Cloudflare, dan Bloomberg.

Dengan penstandaran MCP, paksi persaingan Agentic RAG telah beralih daripada "DB vektor mana yang hendak digunakan" kepada "harness/lapisan kawalan mana yang hendak digunakan." Pinecone menyediakan pelayan MCP, Weaviate Agent Skills berkomunikasi dengan ejen pengekodan melalui MCP, Anthropic sendiri mewujudkan keadaan di mana ribuan sumber data boleh digunakan melalui MCP, dan LangChain serta Microsoft Agent Framework kedua-duanya mendakwa bersifat MCP-native. Akibatnya, nilai penyambung pada bahagian sumber data dengan cepat menjadi komoditi, dan nilai beralih ke arah orkestrasi dan tadbir urus data. Forrester meramalkan bahawa 30% vendor aplikasi perusahaan akan menerbitkan pelayan MCP menjelang akhir tahun 2026.

Mengambil kedudukan bertentangan ialah Responses API OpenAI, yang mengamalkan strategi menyimpan primitif alat hos (file_search, web_search, pemanggilan fungsi) di pihak OpenAI. file_search dalam Responses API berharga $2.50 (kira-kira ¥375) per 1,000 pertanyaan, storan pada $0.10 (kira-kira ¥15) per GB sehari, dan stor vektor yang baru dibuat menyokong sehingga 100 juta fail (diperluaskan daripada 10,000 kepada 100 juta dalam kemas kini November 2025). Assistants API akan ditamatkan pada 26 Ogos 2026, dengan fungsinya disatukan ke dalam Responses API. Pilihan yang dihadapi jurutera adalah jelas — ini merupakan titik persimpangan mengenai autonomi infrastruktur sendiri, iaitu "sama ada hendak menggunakan ekosistem tertutup seperti OpenAI/Microsoft" atau "memiliki lapisan kawalan sendiri dengan MCP + LangChain/LangGraph/Agent Framework." Tulisan Harrison Chase dalam 'Your harness, your memory' yang menyatakan "jika anda memilih sumber tertutup, anda akan kehilangan kawalan ke atas data anda sendiri" adalah mesej tepat yang ditujukan kepada persimpangan ini.

Bab 8 Peruntukan Modal VC Silicon Valley dan Nada Pelaporan Media

Dalam keseluruhan pelaburan VC pada tahun 2025, jumlah dana yang diperoleh berkaitan AI melonjak 75% daripada USD 114 bilion (kira-kira ¥17.1 trilion) pada 2024 kepada lebih USD 202 bilion (kira-kira ¥30.3 trilion), mencakupi kira-kira separuh daripada keseluruhan pelaburan VC. Dalam tawaran peringkat unicorn, Sequoia (51 tawaran / 21 unicorn) dan a16z (50 tawaran / 20 unicorn) memimpin sebagai pasangan terkemuka, diikuti oleh Greylock, Benchmark, Kleiner Perkins, IVP, Index Ventures, Accel, Lightspeed, Coatue, Insight Partners, dan General Catalyst, yang semuanya terlibat secara mendalam dalam tumpukan Agentic RAG. a16z menyatakan secara terbuka bahawa mereka telah membentuk dana terkumpul melebihi USD 15 bilion (kira-kira ¥2.25 trilion) antara 2025 dan 2026, dan bersendirian menggerakkan 18% daripada jumlah pelaburan VC Amerika Syarikat. Sequoia, bersama SoftBank dan Google Ventures, mengumumkan dana baharu bernilai USD 7 bilion (kira-kira ¥1.05 trilion) pada April 2026, menyatakan hasrat untuk mengembangkan pelaburan AI mereka.

Apabila membaca dokumen pemikiran yang diterbitkan oleh setiap VC, pandangan mereka terhadap Agentic RAG menjadi jelas. Dalam *Big Ideas 2026* yang diterbitkan pada Januari 2026, a16z memilih "AI Data Transformation Layer" sebagai kategori permulaan yang asas, menunjukkan bahawa sistem RAG menghadapi "halusinasi akibat sumber yang bercanggah atau lapuk, serta keruntuhan halus dan berkos tinggi dalam aliran kerja ejen," dan berhujah bahawa kualiti data adalah kesesakan yang sebenar. Sequoia, dalam *2026: This is AGI*, mengisytiharkan bahawa "ejen bercakrawala jangka panjang secara fungsional adalah AGI, dan 2026 adalah tahunnya," manakala dalam *AI in 2026: A Tale of Two AIs*, menekankan peralihan daripada kopilot kepada ejen autonomi. Bessemer Venture Partners, dalam *AI Infrastructure Roadmap: Five frontiers for 2026*, menganalisis bahawa "beban kerja inferens kini menyamai latihan dan dalam banyak kes melampaui keperluan pengkomputeran dan kepentingan ekonomi latihan," serta menyatakan secara eksplisit bahawa mereka memerhatikan infrastruktur khusus ejen seperti TensorMesh (LMCache), RadixArk (penghalaan SGLang), dan Inferact (vLLM).

Nada pelaporan pelbagai media juga menunjukkan penumpuan tertentu. TechCrunch melaporkan secara terperinci tentang LangChain dalam *Open-source agentic startup LangChain hits $1.25B valuation* bertarikh 21 Oktober 2025, menekankan keyakinan Sequoia terhadap Agentic RAG menegak dalam *Harvey confirms $11B valuation, Sequoia triples down* bertarikh 25 Mac 2026, dan mengekori komitmen modal Sequoia dalam *New leaders, new fund: Sequoia has raised $7B to expand its AI bets* bertarikh 16 April 2026. The Information melaporkan spekulasi penjualan Pinecone lebih awal, sementara Bloomberg memaparkan pertumbuhan pesat ejen menegak dalam *AI customer support startup Decagon valued at $4.5 billion* bertarikh 28 Januari 2026. CNBC mengikuti penembusan ejen ke dalam syarikat besar menerusi *Glean raises $150M at $7.2 billion valuation* bertarikh 10 Jun 2025. Fortune mendedahkan gambaran ARR LangChain dalam temu bual eksklusif bertarikh 20 Oktober 2025, sementara VentureBeat berulang kali menampilkan keputusan penanda aras Contextual AI.

Melihat kepada peruntukan modal VC antara 2025 dan 2026, terdapat pembelahan yang jelas. Lapisan rangka kerja (LangChain, LlamaIndex, CrewAI) menerima modal dalam lingkungan ratusan juta dolar, namun penilaian hanya mencecah skala satu hingga dua digit bilion dolar. Lapisan DB vektor (Pinecone, Qdrant, Chroma) terus memperoleh dana berterusan dalam lingkungan USD 50 juta hingga USD 100 juta, tetapi tekanan mula terasa apabila Pinecone, raja kategori ini, dilaporkan mempertimbangkan penjualan di bawah tekanan daripada OSS dan penyedia hipersekel. Sebaliknya, Agentic RAG menegak (Harvey, Sierra, Decagon, Hebbia, Glean, Cohere) secara konsisten mendapat dana bernilai ratusan juta hingga lebih USD 1 bilion setiap satu, dengan penilaian mencapai antara USD 4.5 bilion hingga USD 11 bilion. Walaupun membandingkan gandaan ARR kepada penilaian, kecekapan modal pihak menegak jelas lebih tinggi. Ini adalah bukti bahawa dalam persekitaran di mana OpenAI, Anthropic, dan Google DeepMind menguasai kelebihan intelektual di bahagian platform, para VC berpandangan bahawa nilai ekonomi terbesar akan terletak pada "ejen menegak yang menguasai sepenuhnya operasi perniagaan di atas model asas."

Perspektif kritikal turut muncul secara serentak. Gartner, dalam siaran akhbar bertarikh 25 Jun 2025, mengeluarkan amaran bahawa "lebih 40% projek AI beragentik akan dibatalkan menjelang akhir 2027," dengan menyatakan kekurangan tadbir urus dan kebolehmerhatian sebagai punca utama. Laporan *State of AI 2025* McKinsey pada musim luruh 2025 mendapati bahawa lebih 80% perusahaan masih belum merasai sumbangan pendapatan AI generatif, dan kurang daripada 10% organisasi berjaya menskalakan ejen AI mengikut fungsi individu. Jason Lemkin dari SaaStr berulang kali menyebut dalam *SaaS Vibe Check* 2025 bahawa "pemenang adalah pembina sekaligus pencerita," sambil memberi amaran bahawa "ejen AI pengeluaran tanpa pemerhatian dan penilaian adalah bom masa." Fakta yang ditunjukkan oleh penilaian berbilang ejen Anthropic — "penggunaan token 15 kali lebih tinggi berbanding sembang standard" — terus dikutip sebagai angka simbolik yang mewakili masalah kos ini.

Bab 9 Perkembangan Baharu yang Dijangkakan dari Pertengahan Tahun 2026 hingga 2027

Apabila ramalan daripada pelbagai VC, analis, dan badan pemikir digabungkan, gambaran pergerakan yang akan diperhatikan dalam tempoh 12 hingga 18 bulan akan datang menjadi agak jelas.

Pertama, persaingan penstandardan memori jangka panjang dan harness ejen akan bermula secara serius. Lima harness utama — LangChain Deep Agents, Microsoft Agent Framework 1.0, OpenAI Responses API, Anthropic Claude + MCP, dan Databricks Genie Code — akan bersaing untuk mendapatkan kedudukan sebagai "OS ejen" dari separuh kedua 2026 hingga 2027. Mungkin mengambil masa beberapa tahun sebelum pemenang ditentukan, namun dengan penyerahan MCP kepada Linux Foundation, sekurang-kurangnya lapisan penyambung telah dineutralkan. Persidangan LangChain di San Francisco pada 13–14 Mei 2026 (dengan pembentangan oleh Harrison Chase, Jensen Huang, dan Andrew Ng) akan menjadi platform untuk menyatukan kem harness sumber terbuka.

Kedua, pemimpin kategori industri untuk Agentic RAG menegak akan mula ditentukan. Harvey (undang-undang), Hebbia (kewangan), Sierra (perkhidmatan pelanggan), Decagon (perkhidmatan pelanggan / AI Concierge), Glean (carian perusahaan), Writer (kandungan), Spellbook sebagai pesaing Harvey, EvenUp (insurans & kecederaan peribadi), Norm Ai (pematuhan), dan lain-lain — monopoli tunggal "inilah Agentic RAG untuk domain ini" akan berkembang dalam setiap industri. Sequoia, a16z, Coatue, dan Index Ventures dijangka terus melabur tambahan pada peringkat ini, mendorong syarikat-syarikat ini ke tahap IPO. Cohere merupakan calon IPO utama, dengan jangkaan pada S2–S3 2026.

Ketiga, penyusunan semula lapisan pangkalan data vektor akan semakin pesat. Jika pengambilalihan Pinecone berjaya, salah satu daripada Oracle, IBM, Snowflake, atau MongoDB akan menguasai pemimpin kategori tersebut, dan pembahagian yang jelas antara mereka dengan Weaviate, Qdrant, dan Milvus berasaskan OSS akan menjadi lebih ketara. Sebaliknya, jika Turbopuffer dan LanceDB yang didorong oleh storan objek maju ke integrasi natif Alibaba, AWS, dan Azure, terdapat kemungkinan bahawa "kategori bebas pangkalan data vektor" itu sendiri akan terhakis. Sama ada visi Edo Liberty tentang "pangkalan data vektor sebagai memori jangka panjang perusahaan" akan menjadi kenyataan atau tidak akan menjadi jelas menjelang 2027.

Keempat, infrastruktur penilaian dan kebolehperhatian akan berkembang secara mendadak. Platform penilaian dan pemerhatian seperti LangSmith, Arize, Galileo, TruEra, Ragas, Phoenix, dan Braintrust telah pun meneruskan pengumpulan modal berjuta-juta dolar dari 2025 hingga 2026 — dan seperti yang ditunjukkan oleh amaran Gartner bahawa "40% akan dibatalkan," kejayaan atau kegagalan projek berasaskan ejen akhirnya bergantung kepada "sama ada tingkah laku pengeluaran dapat diperhatikan dan kualiti dapat diuruskan secara berangka." Dari separuh kedua 2026 dan seterusnya, AI Observability dijangka membentuk alam semesta tersendiri sebagai kategori bebas.

Kelima, penyertaan penuh syarikat Jepun ke dalam Agentic RAG perusahaan dijangkakan. Terdapat laporan berturutan bahawa syarikat IT dan telekomunikasi besar seperti Rakuten, NTT Data, Fujitsu, NEC, KDDI, SoftBank, Mercari, dan LINE Yahoo akan mengumumkan produk Agentic RAG untuk penggunaan korporat, dan konfigurasi hibrid yang menggabungkan LLM tempatan seperti tsuzumi NTT, Takane Fujitsu, dan cotomi NEC dengan model luar negara seperti Cohere dan Claude dijangka menjadi arus perdana. Apabila keperluan AI berdaulat untuk perolehan kerajaan ditetapkan, kemungkinan besar kehadiran vendor yang mempromosikan "AI berdaulat" seperti Cohere di pasaran Jepun akan berkembang.

Keenam, protokol saling kendali antara ejen (Agent-to-Agent, A2A) akan menjadi barisan penstandardan seterusnya. Microsoft Agent Framework telah mengisytiharkan saling kendali merentas masa jalan A2A + MCP, dan vendor lain turut mengikuti, dengan kemungkinan AAIF (Agentic AI Foundation) menyediakan spesifikasi umum untuk bidang ini. Jika mekanisme untuk ejen mendelegasikan dan menugaskan tugas kepada ejen lain dipiawaikan, Agentic RAG akan berkembang daripada "carian oleh ejen tunggal" kepada "carian oleh ekosistem ejen." Peringkat "penyelarasan berbilang ejen" yang ditunjukkan dalam kertas tinjauan Singh et al. menjadi kenyataan pada peringkat pelaksanaan kemungkinan besar sekitar tahun 2027.

Bab 10 Kesimpulan ―― RAG Agentik Beralih daripada "Alat Carian" kepada "Infrastruktur Intelektual"

Sehingga April 2026, modal VC Silicon Valley mengajar kita satu hakikat: konsep RAG telah melampaui sempadan "alat pencarian" dan telah berevolusi menjadi infrastruktur intelektual itu sendiri dalam dunia enterprise. Ramalan pengasas Pinecone, Edo Liberty, bahawa "pangkalan data vektor akan bertukar menjadi memori jangka panjang enterprise"; pemerhatian Matei Zaharia, pengasas bersama Databricks dan pemenang ACM Prize in Computing 2026, bahawa "AGI sudah pun hadir di sini, hanya sahaja ia tidak wujud dalam bentuk yang kita nilai"; gagasan Harrison Chase yang menuntut "harness dan memori mestilah bersifat terbuka"; serta cita-cita kejuruteraan Douwe Kiela yang mewujudkan "RAG 2.0 sebagai integrasi carian dan penjanaan dalam satu sistem tunggal" — pada titik persilangan semua ini, lapisan infrastruktur yang sedang berkembang bernama Agentic RAG sedang berdiri teguh.

VC Silicon Valley memandang Agentic RAG bukan sekadar subtopik AI, tetapi sebagai perubahan tektonik yang akan menentukan dekad seterusnya dalam perisian enterprise. IVP memberi penilaian 1.25 bilion dolar kepada LangChain, Sequoia melabur dalam Harvey sebanyak tiga kali, a16z memimpin pertumbuhan Hebbia dan Decagon, Coatue terus bertaruh pada ejen menegak, Greycroft/Bain/Lightspeed menyokong RAG 2.0 Contextual AI, dan Wellington Management — sebuah syarikat pengurusan aset tradisional — turut masuk ke Glean. Corak pengagihan modal berbilang lapisan ini menunjukkan bahawa Agentic RAG adalah tema yang merentas tiga domain sekaligus: "pelaburan infrastruktur", "pelaburan aplikasi enterprise", dan "pelaburan produktiviti" — menjadikannya tema dengan julat sasaran yang luar biasa luas.

Namun, realiti seperti "40% pembatalan" yang diramalkan Gartner, "penggunaan token 15 kali ganda" yang dilaporkan Anthropic, dan "rekod penskalaan kurang daripada 10%" yang dinyatakan McKinsey turut menunjukkan bahawa fasa penyesuaian antara gelembung dan jangkaan adalah sesuatu yang tidak dapat dielakkan. Dari penghujung 2026 hingga 2027, Agentic RAG sepatutnya akan matang daripada jangkaan "sihir yang berjalan di mana-mana" kepada "infrastruktur yang tertanam dalam dalam proses perniagaan, disertai ROI yang jelas dan kebolehperhatian yang nyata." Dalam proses itu, juara dan yang tewas akan terpisah dengan jelas. Apa yang perlu diperhatikan oleh jurutera Silicon Valley hari ini bukanlah semata-mata pemilihan rangka kerja atau pangkalan data vektor tertentu, tetapi keputusan seni bina yang lebih asas: "di atas lapisan kawalan yang mana, memori jangka panjang syarikat kita harus diletakkan?" Apabila kita menoleh ke belakang melihat Agentic RAG pada 2027, kita pasti akan mengingatnya sebagai "titik peralihan di mana falsafah reka bentuk aplikasi AI beralih daripada model berasaskan saluran paip kepada model berasaskan proses."


Bab 10 Penutup ―― Agentic RAG: Dari "Alat Carian" kepada "Infrastruktur Intelek"

Pada April 2026, modal VC Silicon Valley memberitahu kita satu fakta: konsep RAG telah melampaui kategori "alat pencarian" dan berkembang menjadi infrastruktur intelektual itu sendiri dalam lingkungan enterprise. Ramalan pengasas Pinecone, Edo Liberty, yang menyatakan "pangkalan data vektor akan bertukar menjadi memori jangka panjang enterprise"; pemerhatian Matei Zaharia, pengasas bersama Databricks dan penerima ACM Prize in Computing 2026, yang menyatakan "AGI sudah ada di sini, hanya saja ia tidak wujud dalam bentuk yang kita nilai"; gagasan Harrison Chase yang menegaskan "harness dan memori harus bersifat terbuka"; serta cita-cita kejuruteraan Douwe Kiela yang menjelmakan "RAG 2.0 sebagai integrasi pencarian dan penjanaan dalam satu sistem tunggal" — di titik persilangan semua ini, lapisan infrastruktur yang sedang berkembang bernama Agentic RAG sedang bangkit.

VC Silicon Valley memandang Agentic RAG bukan sekadar subtopik AI, melainkan sebagai pergeseran tektonik yang akan menentukan dekad seterusnya dalam perisian enterprise. IVP menilai LangChain pada USD 1.25 bilion, Sequoia melabur dalam Harvey sebanyak tiga kali, a16z memimpin pertumbuhan Hebbia dan Decagon, Coatue terus bertaruh pada ejen vertikal, Greycroft/Bain/Lightspeed menyokong RAG 2.0 milik Contextual AI, dan Wellington Management — syarikat pengurusan aset tradisional — turut masuk ke Glean. Pola pengagihan modal berbilang lapisan ini menunjukkan bahawa Agentic RAG adalah tema yang merentasi tiga domain: "pelaburan infrastruktur", "pelaburan aplikasi enterprise", dan "pelaburan produktiviti" — dengan jangkauan yang amat luas.

Namun, realiti yang ditunjukkan oleh "pembatalan 40%" yang diramalkan Gartner, "penggunaan token 15 kali ganda" yang dilaporkan Anthropic, dan "rekod skala di bawah 10%" yang dikenal pasti McKinsey turut membayangkan bahawa fasa penyesuaian antara gelembung spekulatif dan jangkaan adalah tidak dapat dielakkan. Menjelang separuh akhir 2026 hingga 2027, Agentic RAG sepatutnya akan matang daripada jangkaan "sihir yang berfungsi di mana-mana" kepada "infrastruktur yang tertanam dalam proses operasi, disertai ROI yang jelas dan kebolehperhatiaan yang nyata." Dalam proses itu, pemenang dan yang kalah akan terbeza dengan jelas. Apa yang perlu diperhatikan oleh jurutera Silicon Valley hari ini bukanlah pemilihan kerangka kerja atau pangkalan data vektor tertentu itu sendiri, melainkan pertimbangan seni bina yang lebih asas: "di atas lapisan kawalan mana memori jangka panjang syarikat kita akan diletakkan?" Apabila kita menoleh ke belakang untuk melihat Agentic RAG pada 2027, kita akan mengenangnya sebagai "titik peralihan di mana falsafah reka bentuk aplikasi AI beralih daripada model paip kepada model proses."


Sumber

  • Singh, Ehtesham, Kumar, Khoei, Vasilakos, "Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG" (arXiv:2501.09136) — https://arxiv.org/abs/2501.09136
  • Asai et al., "Self-RAG: Learning to Retrieve, Generate, and Critique through Self-Reflection" (arXiv:2310.11511) — https://arxiv.org/abs/2310.11511
  • Yan et al., "Corrective Retrieval Augmented Generation" (arXiv:2401.15884) — https://arxiv.org/abs/2401.15884
  • Jeong, Baek, Cho, Hwang, Park, "Adaptive-RAG" (arXiv:2403.14403) — https://arxiv.org/abs/2403.14403
  • Yao et al., "ReAct: Synergizing Reasoning and Acting in Language Models" (arXiv:2210.03629) — https://arxiv.org/abs/2210.03629
  • Edge et al., Microsoft Research, "From Local to Global: A Graph RAG Approach to Query-Focused Summarization" (arXiv:2404.16130) — https://arxiv.org/abs/2404.16130
  • Microsoft Research, "LazyGraphRAG: Menetapkan Piawaian Baharu untuk Kualiti dan Kos" — https://www.microsoft.com/en-us/research/blog/lazygraphrag-setting-a-new-standard-for-quality-and-cost/
  • Microsoft Research, Projek GraphRAG — https://www.microsoft.com/en-us/research/project/graphrag/
  • Microsoft Research, "BenchmarkQED: Penanda aras automatik sistem RAG" — https://www.microsoft.com/en-us/research/blog/benchmarkqed-automated-benchmarking-of-rag-systems/
  • Anthropic Engineering, "Cara kami membina sistem penyelidikan berbilang ejen" — https://www.anthropic.com/engineering/multi-agent-research-system
  • Anthropic, "Memperkenalkan Contextual Retrieval" — https://www.anthropic.com/news/contextual-retrieval
  • Anthropic, "Memperkenalkan Model Context Protocol" — https://www.anthropic.com/news/model-context-protocol
  • Anthropic, "Menderma Model Context Protocol dan menubuhkan Agentic AI Foundation" — https://www.anthropic.com/news/donating-the-model-context-protocol-and-establishing-of-the-agentic-ai-foundation
  • Spesifikasi Model Context Protocol 2025-11-25 — https://modelcontextprotocol.io/specification/2025-11-25
  • Blog Pembangun NVIDIA, "RAG Tradisional vs RAG Agentik — Mengapa Ejen AI Memerlukan Pengetahuan Dinamik untuk Menjadi Lebih Bijak" — https://developer.nvidia.com/blog/traditional-rag-vs-agentic-rag-why-ai-agents-need-dynamic-knowledge-to-get-smarter/
  • NVIDIA AI Blueprints, Pelaksanaan rujukan RAG — https://github.com/NVIDIA-AI-Blueprints/rag
  • Cohere, "Rerank" — https://cohere.com/rerank
  • Cohere Docs, "Command A" — https://docs.cohere.com/docs/command-a
  • BAAI, "BGE Reranker v2-m3" — https://huggingface.co/BAAI/bge-reranker-v2-m3
  • Khattab dan Zaharia, "ColBERT" (arXiv:2004.12832) — https://arxiv.org/abs/2004.12832
  • OpenAI, "Alat Baharu untuk Membina Ejen" — https://openai.com/index/new-tools-for-building-agents/
  • OpenAI, "Alat dan ciri baharu dalam Responses API" — https://openai.com/index/new-tools-and-features-in-the-responses-api/
  • Pembangun OpenAI, "Orkestrasi alat Responses API" — https://developers.openai.com/cookbook/examples/responses_api/responses_api_tool_orchestration
  • Dokumen Platform OpenAI, "Panduan Penyelidikan Mendalam" — https://platform.openai.com/docs/guides/deep-research
  • Andreessen Horowitz, "Idea Besar 2026 (Bahagian 1)" — https://a16z.com/newsletter/big-ideas-2026-part-1/
  • Andreessen Horowitz, "Kebangkitan Penggunaan Komputer dan Rakan Sekerja Agentik" — https://a16z.com/the-rise-of-computer-use-and-agentic-coworkers/
  • Andreessen Horowitz, "Pangkalan Data Vektor dan Kuasa RAG" — https://a16z.com/podcast/vector-databases-and-the-power-of-rag/
  • Andreessen Horowitz, "Melabur dalam Hebbia" — https://a16z.com/announcement/investing-in-hebbia/
  • Sequoia Capital, "2026: Inilah AGI" — https://sequoiacap.com/article/2026-this-is-agi/
  • Sequoia Capital, "AI pada 2026: Kisah Dua AI" — https://sequoiacap.com/article/ai-in-2026-the-tale-of-two-ais/
  • Podcast Sequoia Capital, "Kejuruteraan Konteks Menuju Ejen Jangka Panjang" (Harrison Chase) — https://sequoiacap.com/podcast/context-engineering-our-way-to-long-horizon-agents-langchains-harrison-chase/
  • Sequoia Capital, "LangChain: Dari Ejen 0 ke 1 hingga Kejuruteraan Agentik" — https://sequoiacap.com/article/langchain-from-agent-0-to-1-to-agentic-engineering/
  • Bessemer Venture Partners, "Peta Jalan Infrastruktur AI: Lima sempadan untuk 2026" — https://www.bvp.com/atlas/ai-infrastructure-roadmap-five-frontiers-for-2026
  • Bessemer Venture Partners, "Melindungi Ejen AI" — https://www.bvp.com/atlas/securing-ai-agents-the-defining-cybersecurity-challenge-of-2026
  • Siaran Akhbar Gartner, "40% aplikasi perusahaan akan menampilkan ejen AI khusus tugas menjelang 2026" — https://www.gartner.com/en/newsroom/press-releases/2025-08-26-gartner-predicts-40-percent-of-enterprise-apps-will-feature-task-specific-ai-agents-by-2026-up-from-less-than-5-percent-in-2025
  • Siaran Akhbar Gartner, "Lebih 40% projek AI Agentik akan dibatalkan menjelang akhir 2027" — https://www.gartner.com/en/newsroom/press-releases/2025-06-25-gartner-predicts-over-40-percent-of-agentic-ai-projects-will-be-canceled-by-end-of-2027
  • Gartner, Ramalan perisian SCM dengan AI Agentik sebanyak $53B — https://www.gartner.com/en/newsroom/press-releases/2026-04-07-gartner-forecasts-supply-chain-management-software-with-agentic-ai-will-grow-to-53-billion-in-spend-by-2030
  • McKinsey, "Keadaan kepercayaan AI pada 2026: Beralih ke era agentik" — https://www.mckinsey.com/capabilities/tech-and-ai/our-insights/tech-forward/state-of-ai-trust-in-2026-shifting-to-the-agentic-era
  • McKinsey, "Merebut Kelebihan AI Agentik" — https://www.mckinsey.com/capabilities/quantumblack/our-insights/seizing-the-agentic-ai-advantage
  • McKinsey, "Keadaan AI 2025: Ejen, Inovasi" — https://www.mckinsey.com/~/media/mckinsey/business%20functions/quantumblack/our%20insights/the%20state%20of%20ai/november%202025/the-state-of-ai-2025-agents-innovation_cmyk-v1.pdf
  • MarketsandMarkets, Laporan Pasaran RAG — https://www.marketsandmarkets.com/PressReleases/retrieval-augmented-generation-rag.asp
  • MarketsandMarkets, Pasaran Pangkalan Data Vektor — https://www.marketsandmarkets.com/Market-Reports/vector-database-market-112683895.html
  • Grand View Research, Pasaran RAG — https://www.grandviewresearch.com/industry-analysis/retrieval-augmented-generation-rag-market-report
  • Fortune Business Insights, Pasaran AI Agentik — https://www.fortunebusinessinsights.com/agentic-ai-market-114233
  • Blog LangChain, "Pengumuman Siri B" — https://blog.langchain.com/series-b/
  • TechCrunch, "Syarikat permulaan agentik sumber terbuka LangChain capai penilaian $1.25B" — https://techcrunch.com/2025/10/21/open-source-agentic-startup-langchain-hits-1-25b-valuation/
  • Fortune, "Bintang AI awal LangChain kini menjadi unicorn" — https://fortune.com/2025/10/20/exclusive-early-ai-darling-langchain-is-now-a-unicorn-with-a-fresh-125-million-in-funding/
  • Blog LangChain, "Kerangka kerja anda, memori anda" — https://www.langchain.com/blog/your-harness-your-memory
  • Blog LangChain, Perkongsian perusahaan NVIDIA — https://blog.langchain.com/nvidia-enterprise/
  • Surat Berita LangChain, Mac 2026 — https://www.langchain.com/blog/march-2026-langchain-newsletter
  • TechCrunch, "LlamaIndex melancarkan perkhidmatan awan untuk membina ejen data tidak berstruktur" — https://techcrunch.com/2025/03/04/llamaindex-launches-a-cloud-service-for-building-unstructed-data-agents/
  • Blog LlamaIndex, "Siri A dan Ketersediaan Umum LlamaCloud" — https://www.llamaindex.ai/blog/announcing-our-series-a-and-llamacloud-general-availability
  • Blog LlamaIndex, "LlamaIndex lebih daripada sekadar kerangka kerja RAG" — https://www.llamaindex.ai/blog/llamaindex-is-more-than-a-rag-framework
  • PRNewswire, "LlamaIndex Mendapatkan $19 Juta Siri A" — https://www.prnewswire.com/news-releases/llamaindex-secures-19-million-series-a-to-power-enterprise-grade-knowledge-agents-302390936.html
  • Norwest Venture Partners, "LlamaIndex" — https://www.norwest.com/blog/llamaindex-harnesses-the-power-of-enterprise-data-for-ai-agent-workflows/
  • Pulse2, "Platform Berbilang Ejen CrewAI Mengumpul $18J Siri A" — https://pulse2.com/crewai-multi-agent-platform-raises-18-million-series-a/
  • Insight Partners, "Kisah AI ScaleUp CrewAI" — https://www.insightpartners.com/ideas/crewai-scaleup-ai-story/
  • Enterprise AI World, CrewAI $18J — https://www.enterpriseaiworld.com/Articles/News/News/$18M-in-Funding-Catapults-CrewAIs-Multi-Agentic-Platform-to-the-Enterprise-Level-166495.aspx
  • deepset, "Pengumuman Pembiayaan Balderton Capital" — https://www.deepset.ai/news/funding-announcement-balderton-capital
  • deepset, "Memperkenalkan Platform Perusahaan Haystack" — https://www.deepset.ai/blog/introducing-haystack-enterprise-platform
  • Visual Studio Magazine, "Microsoft menghantar Kerangka Kerja Ejen 1.0 sedia pengeluaran" — https://visualstudiomagazine.com/articles/2026/04/06/microsoft-ships-production-ready-agent-framework-1-0-for-net-and-python.aspx
  • Microsoft Learn, "Gambaran Keseluruhan Kerangka Kerja Ejen" — https://learn.microsoft.com/en-us/agent-framework/overview/
  • Visual Studio Magazine, "Semantic Kernel + AutoGen Kerangka Kerja Ejen Microsoft sumber terbuka" — https://visualstudiomagazine.com/articles/2025/10/01/semantic-kernel-autogen--open-source-microsoft-agent-framework.aspx
  • Dify — https://dify.ai/
  • Blog Pinecone, "Siri B" — https://www.pinecone.io/blog/series-b/
  • TechCrunch, "Pinecone mendapat pelaburan $100J pada penilaian $750J" — https://techcrunch.com/2023/04/27/pinecone-drops-100m-investment-on-750m-valuation-as-vector-database-demand-grows/
  • VentureBeat, "Pengasas Pinecone Edo Liberty melantik Ash dari Google sebagai CEO" — https://venturebeat.com/data-infrastructure/pinecone-founder-edo-liberty-appoints-googler-ash-as-ceo
  • PRNewswire, Peralihan CEO Pinecone — https://www.prnewswire.com/news-releases/pinecone-founder-edo-liberty-to-spearhead-pinecones-growing-ai-ambitions-appoints-ash-ashutosh-as-ceo-to-expand-vector-database-market-leadership-302549334.html
  • Calcalist Tech, Spekulasi penjualan Pinecone — https://www.calcalistech.com/ctechnews/article/rz31q82b5
  • TechTarget SearchDataManagement, Pinecone menjangkau masa hadapan — https://www.techtarget.com/searchdatamanagement/news/366631366/Vector-database-vendor-Pinecone-eyes-future-under-new-CEO
  • Blog Pinecone, "Pinecone Assistant Tersedia Secara Umum" — https://www.pinecone.io/blog/pinecone-assistant-generally-available/
  • Weaviate, "Siri B Weaviate" — https://www.prnewswire.com/news-releases/weaviate-raises-50-million-series-b-funding-to-meet-soaring-demand-for-ai-native-vector-database-technology-301803296.html
  • Weaviate, Weaviate Beralih ke Tumpukan Penuh — https://www.globenewswire.com/news-release/2025/03/04/3036570/0/en/Weaviate-Goes-Full-Stack-With-Launch-of-Weaviate-Agents-for-AI-Development.html
  • Blog Weaviate, Ejen Pertanyaan — https://weaviate.io/blog/query-agent
  • Blog Weaviate, Ulasan tahunan 2025 — https://weaviate.io/blog/weaviate-in-2025
  • Weaviate, Pelancaran Kemahiran Ejen — https://www.globenewswire.com/news-release/2026/02/21/3242244/0/en/Weaviate-Launches-Agent-Skills-to-Empower-AI-Coding-Agents.html
  • Weaviate, Pengiktirafan Pemimpin GigaOm / Pemimpin Baru Muncul Gartner — https://www.globenewswire.com/news-release/2026/01/14/3218396/0/en/Weaviate-named-a-Leader-and-Outperformer-by-GigaOm-and-Emerging-Leader-by-Gartner-Market-Momentum-Accelerates-as-Nonrelational-DBMS-Segment-Grows-22-7.html
  • TechCrunch, "Pangkalan data vektor sumber terbuka Qdrant" — https://techcrunch.com/2024/01/23/qdrant-open-source-vector-database/
  • Blog Qdrant, "Pusingan pembiayaan Siri A" — https://qdrant.tech/blog/series-a-funding-round/
  • BusinessWire, "Qdrant Mengumpul $50J Siri B" — https://www.businesswire.com/news/home/20260312313902/en/Qdrant-Raises-$50-Million-Series-B-to-Define-Composable-Vector-Search-as-Core-Infrastructure-for-Production-AI
  • Syarikat Chroma, "Benih" — https://www.trychroma.com/company/seed
  • Medium, "Pelaburan kami dalam Chroma (Astasia Myers)" — https://medium.com/memory-leak/our-investment-in-chroma-the-developer-centric-embedding-database-34277ac327e8
  • Salestools, Laporan Siri B Chroma — https://salestools.io/en/report/chroma-raises-18m-series-b
  • TechCrunch, "Zilliz berpindah ke SF, mengumpul $60J" — https://techcrunch.com/2022/08/24/zilliz-the-startup-behind-the-milvus-open-source-vector-database-for-ai-applications-raises-60m-and-relocates-to-sf/
  • Yahoo Finance, "Milvus melebihi 40,000 bintang GitHub" — https://finance.yahoo.com/news/milvus-surpasses-40-000-github-010000562.html
  • TechCrunch, Pemisahan Vespa — https://techcrunch.com/2023/10/04/yahoo-spins-out-vespa-its-search-tech-into-an-independent-company/
  • Vespa.ai, Pembiayaan Blossom Capital — https://vespa.ai/2023-11-01-blossom-funding/
  • Tracxn, Profil LanceDB — https://tracxn.com/d/companies/lancedb/__ie1HuEEUoPOIc3tEX5yowY9yMJz9kdNTH01mwCePxLw
  • BetaKit, Turbopuffer mengumpul pembiayaan — https://betakit.com/ex-shopify-engineers-raise-fresh-financing-to-scale-turbopuffers-ai-search/
  • Turbopuffer, Tentang Kami — https://turbopuffer.com/about
  • SiliconANGLE, Contextual AI mendapat $80J untuk RAG 2.0 — https://siliconangle.com/2024/08/02/contextual-ai-nabs-80m-rag-2-0-platform/
  • Blog Contextual AI, Ketersediaan Umum Platform — https://contextual.ai/blog/platform-ga-press-release
  • Penyelidikan Contextual AI, Memperkenalkan RAG 2.0 — https://contextual.ai/research/introducing-rag2
  • VentureBeat, Contextual AI mengatasi GPT-4o — https://venturebeat.com/ai/contextual-ais-new-ai-model-crushes-gpt-4o-in-accuracy-heres-why-it-matters
  • VentureBeat, Contextual AI Agent Composer — https://venturebeat.com/technology/contextual-ai-launches-agent-composer-to-turn-enterprise-rag-into-production
  • Morningstar PRNewswire, Pelancaran Agent Composer — https://www.morningstar.com/news/pr-newswire/20260127sf71236/contextual-ai-launches-agent-composerai-for-when-it-actually-is-rocket-science
  • TechCrunch, "Cohere mencapai penilaian $7B dan bermitra dengan AMD" — https://techcrunch.com/2025/09/24/cohere-hits-7b-valuation-a-month-after-its-last-raise-partners-with-amd/
  • PSP Investments / Pengumuman pembiayaan Cohere — https://www.investpsp.com/en/news/fresh-funding-enables-cohere-to-accelerate-its-global-expansion-and-build-the-next-generation-of-secure-enterprise-and-sovereign-ai-solutions/
  • Futurum Group, "Kelebihan AI berdaulat pelbagai bahasa Cohere menjelang IPO 2026" — https://futurumgroup.com/insights/coheres-multilingual-sovereign-ai-moat-ahead-of-a-2026-ipo/
  • InfoWorld, "Cohere melangkah ke utara dengan AI agentik" — https://www.infoworld.com/article/3757962/cohere-goes-north-with-agentic-ai.html
  • Siri A Vectara, BusinessWire — https://www.businesswire.com/news/home/20240716489550/en/Vectara-Secures-%2425-Million-Series-A-Funding-to-Advance-the-Trustworthiness-of-Retrieval-Augmented-Generation-with-New-Mockingbird-LLM
  • Glean, Siri F $150J — https://www.glean.com/press/glean-raises-150m-series-f-at-7-2b-valuation-to-accelerate-enterprise-ai-agent-innovation-globally
  • TechCrunch, Glean penilaian $7.2B — https://techcrunch.com/2025/06/10/enterprise-ai-startup-glean-lands-a-7-2b-valuation/
  • CNBC, Glean $150J Siri F — https://www.cnbc.com/2025/06/10/glean-gen-ai-search-startup-raises-150-million-at-7-billion-value.html
  • TechCrunch, Perplexity $200J pada $20B — https://techcrunch.com/2025/09/10/perplexity-reportedly-raised-200m-at-20b-valuation/
  • Writer.com, Pengumuman Siri C — https://writer.com/blog/series-c-funding-writer-press-release/
  • TechCrunch, Writer $200J pada $1.9B — https://techcrunch.com/2024/11/12/generative-ai-startup-writer-raises-200m-at-a-1-9b-valuation/
  • TechCrunch, Hebbia $130J Siri B — https://techcrunch.com/2024/07/09/ai-startup-hebbia-rased-130m-at-a-700m-valuation-on-13-million-of-profitable-revenue/
  • Blog Hebbia, Siri B — https://www.hebbia.com/blog/hebbia-raises-usd130m-series-b
  • TechCrunch, Harvey penilaian $11B — https://techcrunch.com/2026/03/25/harvey-confirms-11b-valuation-sequoia-triples-down/
  • CNBC, Harvey $200J pada $11B — https://www.cnbc.com/2026/03/25/legal-ai-startup-harvey-raises-200-million-at-11-billion-valuation.html
  • Harvey, Pengumuman Siri — https://www.harvey.ai/blog/harvey-raises-at-dollar11-billion-valuation-to-scale-agents-across-law-firms-and-enterprises
  • TechCrunch, Harvey $8B Disember 2025 — https://techcrunch.com/2025/12/04/legal-ai-startup-harvey-confirms-8b-valuation/
  • TechCrunch, Bret Taylor Sierra $350J pada $10B — https://techcrunch.com/2025/09/04/bret-taylors-sierra-raises-350m-at-a-10b-valuation/
  • TechCrunch, Sierra $100J ARR — https://techcrunch.com/2025/11/21/bret-taylors-sierra-reaches-100m-arr-in-under-two-years/
  • CNBC, Sierra penilaian $10B — https://www.cnbc.com/2025/09/04/bret-taylor-sierra-ai-startup-salesforce-openai.html
  • Blog Decagon, Pengumuman Siri D — https://decagon.ai/blog/series-d-announcement
  • Bloomberg, Decagon penilaian $4.5B — https://www.bloomberg.com/news/articles/2026-01-28/ai-customer-support-startup-decagon-valued-at-4-5-billion
  • Blog Decagon, Siri C — https://decagon.ai/resources/series-c-announcement
  • BusinessWire, Decagon Siri D — https://www.businesswire.com/news/home/20260128580542/en/Decagons-Valuation-Triples-to-$4.5-Billion-as-it-Ushers-in-the-Age-of-AI-Concierge
  • Sana Labs, Pengumuman Siri B — https://sanalabs.com/resources/announcing-sanas-series-b-round
  • Sana Labs, Sambungan Siri B — https://sanalabs.com/resources/sana-reaches-62m-dollars-in-series-b-funding
  • You.com, Pengumuman Siri C — https://you.com/resources/series-c
  • TechStartups, You.com penilaian $1.5B — https://techstartups.com/2025/09/04/you-com-raises-100m-series-c-in-funding-at-1-5b-valuation-to-scale-ai-search-infrastructure/
  • TechCrunch, Databricks $4B pada $134B — https://techcrunch.com/2025/12/16/databricks-raises-4b-at-134b-valuation-as-its-ai-business-heats-up/
  • Databricks, Pengambilalihan MosaicML — https://www.databricks.com/company/newsroom/press-releases/databricks-completes-acquisition-mosaicml
  • Blog Databricks, Genie Code — https://www.databricks.com/blog/introducing-genie-code
  • Databricks, Pelancaran Agent Bricks — https://www.databricks.com/company/newsroom/press-releases/databricks-launches-agent-bricks-new-approach-building-ai-agents
  • TechCrunch, Matei Zaharia memenangi Hadiah Pengkomputeran ACM — https://techcrunch.com/2026/04/08/databricks-matei-zaharia-wins-acm-computing-prize-agi/
  • TechCrunch, Sequoia mengumpul $7B untuk AI — https://techcrunch.com/2026/04/16/new-leaders-new-fund-sequoia-has-raised-7b-to-expand-its-ai-bets/
  • Nota Keluaran Snowflake, Cortex Agents Tersedia Secara Umum — https://docs.snowflake.com/en/release-notes/2025/other/2025-11-04-cortex-agents
  • Snowflake, Gambaran keseluruhan Cortex — https://www.snowflake.com/en/product/features/cortex/
  • Snowflake, Cortex Code — https://www.snowflake.com/en/product/features/cortex-code/
  • SaaStr, "Semakan Keadaan SaaS 2025 bersama Jason Lemkin" — https://www.saastr.com/the-2025-saas-vibe-check-what-founders-need-to-know-right-now-with-saastr-ceo-and-founder-jason-lemkin/
  • Jahanzaib.ai, "Panduan Pengeluaran RAG Agentik" — https://www.jahanzaib.ai/blog/agentic-rag-production-guide
  • Suprmind, "Kadar dan Penanda Aras Halusinasi AI" — https://suprmind.ai/hub/ai-hallucination-rates-and-benchmarks/