Bab 1 Mengapa RAG Kini Harus Menjadi "Agentic"

Makalah tahun 2020 berjudul *Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks* yang diunggah ke arXiv oleh Douwe Kiela dan rekan-rekannya semasa di Facebook AI Research merupakan asal-usul istilah RAG yang dikenal saat ini. Prosedur yang diusulkan dalam makalah tersebut kemudian dikenal sebagai "Naive RAG" — sebuah pipeline sederhana yang mengubah kueri menjadi embedding, mengambil k chunk terdekat dalam ruang vektor, lalu menyisipkannya sebagai konteks ke dalam LLM. Sejak kemunculan ChatGPT pada akhir 2022, Naive RAG menyebar dengan kecepatan luar biasa, namun antara tahun 2023 hingga 2024, tiga hambatan utama mulai terlihat jelas di lapangan implementasi enterprise.

Pertama, desain yang mencoba merepresentasikan semua kueri dalam satu ruang embedding terbukti secara struktural lemah terhadap kueri panjang dengan maksud yang beragam, maupun pertanyaan yang membutuhkan penalaran multi-langkah. Kedua, pencarian vektor memang unggul dalam mengembalikan dokumen yang "secara semantik mirip," namun tidak dapat menjamin dokumen yang "secara faktual benar terhadap kueri." Ketiga, data perusahaan tidak hanya berupa dokumen tidak terstruktur, melainkan tersebar di tabel SQL, knowledge graph, API, dan event real-time, sehingga pendekatan menjejalkan semuanya ke dalam satu vector DB menjadi tidak realistis.

Di dunia akademis, antara 2023 dan 2024, serangkaian makalah muncul untuk mendobrak keterbatasan ini. Self-RAG oleh Asai et al. (arXiv:2310.11511, Oktober 2023) memperkenalkan mekanisme *reflection token* di mana LLM itu sendiri menentukan "apakah perlu melakukan retrieve" dan "apakah hasil retrieve layak," membuka jalan bagi model untuk memutuskan secara dinamis kapan harus melakukan pencarian. CRAG (*Corrective RAG*, arXiv:2401.15884) yang dipresentasikan oleh Yan et al. pada Januari 2024 menunjukkan desain di mana evaluator pencarian ringan mengembalikan skor kepercayaan, dan ketika kepercayaan rendah, pencarian web diaktifkan sebagai augmentasi eksternal. Adaptive-RAG (arXiv:2403.14403, diterima di NAACL 2024) yang dipresentasikan oleh Jeong et al. pada Maret 2024 mengusulkan pendekatan tiga tahap: menempatkan LM kecil di depan untuk mengklasifikasikan kompleksitas kueri, lalu merutekan kueri sederhana tanpa pencarian, kueri menengah ke pencarian tunggal, dan kueri kompleks ke pencarian iteratif. Makalah-makalah ini dibangun di atas desain dasar pola ReAct (Yao et al., arXiv:2210.03629, ICLR 2023) yang "menjalin penalaran dan tindakan secara bergantian," dan pada awal 2025 telah membentuk standar industri de facto.

Arus ini kemudian disistematisasi pada Januari 2025 oleh Singh, Ehtesham, Kumar, Khoei, Vasilakos, dan rekan-rekan dalam *A Survey of Agentic Retrieval-Augmented Generation for Large Language Models* (arXiv:2501.09136), yang mengorganisir evolusi RAG ke dalam empat generasi: "Naive RAG → Advanced RAG → Modular RAG → Agentic RAG." Makalah tersebut mendefinisikan Agentic RAG sebagai sistem yang "mengelola strategi pencarian secara dinamis dan menyempurnakan pemahaman konteks secara iteratif dengan menanamkan pola desain seperti refleksi, perencanaan, penggunaan alat, dan koordinasi multi-agen."

Jika dirangkum dari sudut pandang insinyur Silicon Valley, Naive RAG adalah "pemanggilan fungsi," sedangkan Agentic RAG adalah "eksekusi proses." Yang pertama adalah pipeline satu arah dari kueri ke jawaban, sedangkan yang kedua memiliki state dan loop, mampu melakukan retry, routing, dan pemanggilan alat sesuai kebutuhan — lebih menyerupai proses OS. Blog engineering Anthropic yang dipublikasikan Juni 2025 berjudul *How we built our multi-agent research system* melaporkan bahwa konfigurasi orkestrator-worker yang menempatkan Claude Opus 4 sebagai pemimpin dan Claude Sonnet 4 sebagai sub-agen mengungguli Claude Opus 4 tunggal sebesar 90,2% dalam evaluasi internal, secara kuantitatif menunjukkan keunggulan konfigurasi multi-agen. Namun di saat yang sama, laporan itu juga secara jujur mengungkapkan bahwa "multi-agen mengonsumsi sekitar 15 kali lebih banyak token dibanding chat standar" dan "penggunaan token menjelaskan 80% varians performa dalam evaluasi browsing" — menunjukkan bahwa performa ini hanya dapat diperoleh dengan biaya yang sepadan.

Data pasar pun menguatkan transformasi ini. Gartner dalam siaran pers tertanggal 26 Agustus 2025 memproyeksikan bahwa proporsi aplikasi yang dilengkapi agen AI khusus tugas, yang masih di bawah 5% pada 2025, akan melonjak hingga 40% pada akhir 2026. Diproyeksikan pula bahwa pada 2028, 33% perangkat lunak enterprise akan menyematkan AI berbasis agen, dan 70% aplikasi AI akan menggunakan pendekatan multi-agen. Menurut laporan MarketsandMarkets, pasar RAG sendiri akan tumbuh dari 1,94 miliar dolar (sekitar 291 miliar yen) pada 2025 menjadi 9,86 miliar dolar (sekitar 1,479 triliun yen) pada 2030 dengan CAGR 38,4%, sementara kalkulasi Grand View Research memperkirakan CAGR 49,1% dengan nilai mencapai 11 miliar dolar (sekitar 1,65 triliun yen) pada 2030. Pasar vector DB diperkirakan oleh MarketsandMarkets tumbuh dari 2,65 miliar dolar (sekitar 397,5 miliar yen) pada 2025 menjadi 8,95 miliar dolar (sekitar 1,342 triliun yen) pada 2030 dengan CAGR 27,5%, sedangkan Fortune Business Insights memproyeksikan pasar AI berbasis agen secara keseluruhan akan tumbuh secara eksplosif dari 9,14 miliar dolar (sekitar 1,371 triliun yen) pada 2026 menjadi 139,19 miliar dolar (sekitar 20,878 triliun yen) pada 2034 dengan CAGR 40,5%. Angka-angka ini telah mengangkat Agentic RAG dari "eksperimen sejumlah lab AI" menjadi "pasar infrastruktur bernilai triliunan yen."

Bab 2 Teknologi Inti dan Pola Desain Agentic RAG

Jika seorang engineer mendefinisikan Agentic RAG dalam satu kalimat, maka itu adalah "sistem yang memiliki loop pemanggilan pencarian sebagai alat, dan memperbarui status serta pengambilan keputusan di setiap iterasi loop." Dalam definisi ini, setidaknya terdapat enam elemen teknis independen yang terjalin satu sama lain.

Elemen pertama adalah query routing, query rewriting (penulisan ulang kueri), query decomposition (dekomposisi kueri), dan HyDE (Hypothetical Document Embedding). Routing berarti bahwa agen yang menerima kueri pengguna menentukan apakah kueri tersebut harus dikirimkan ke vector DB, dikonversi menjadi kueri SQL, diteruskan ke pencarian web, atau diterjemahkan menjadi kueri Cypher untuk knowledge graph. Rewriting adalah proses mengubah ekspresi lisan pengguna menjadi bentuk yang optimal untuk pencarian, dan sering menggunakan LLM berskala kecil. Decomposition adalah proses memecah pertanyaan kompleks seperti "bagaimana B berbeda dibandingkan A, dan bagaimana hubungannya dengan C" menjadi beberapa sub-kueri. HyDE adalah metode yang diusulkan oleh Gao et al. (2022), di mana LLM diminta menghasilkan jawaban hipotetis terhadap kueri pengguna, kemudian teks jawaban hipotetis tersebut di-embedding dan digunakan untuk pencarian, dengan tujuan mempersempit kesenjangan gaya antara kueri dan dokumen.

Elemen kedua adalah hybrid search (pencarian hibrida). Antara tahun 2025 hingga 2026, konsensus industri telah mengkerucut pada struktur tiga lapis "dense (vektor padat) + sparse (BM25/SPLADE) + reranking." Dense menangkap kemiripan semantik, sparse menangkap kesesuaian leksikal, dan keduanya saling melengkapi kekurangan masing-masing. Implementasi referensi RAG Blueprint yang diterbitkan NVIDIA di GitHub menyediakan hybrid search dense+sparse, pencarian multi-koleksi, dan indeks/kueri berakselerasi GPU dengan beralih secara pluggable antara ElasticSearch dan Milvus, serta menstandarisasi fusi melalui Reciprocal Rank Fusion (RRF). *Contextual Retrieval* yang diterbitkan Anthropic pada September 2024 menambahkan preprocessing berupa penambahan teks konteks menggunakan Claude sebelum chunk di-embedding, dan menunjukkan hasil yang mengejutkan: pengurangan tingkat kegagalan pencarian top-20 sebesar 35% dibandingkan embedding sederhana, 49% dengan kombinasi BM25, dan 67% dengan kombinasi reranking—sekaligus mengubah standar implementasi preprocessing pengindeksan RAG secara drastis.

Elemen ketiga adalah reranking. Ini adalah proses menerapkan cross-encoder yang lebih mahal secara komputasi pada kumpulan kandidat yang diperoleh dari pencarian dense dan sparse untuk mengubah urutannya. Rerank 3 yang dirilis Cohere pada September 2024 memiliki panjang konteks 4K, dan perusahaan tersebut mengklaim bahwa "Rerank hanya meneruskan dokumen yang paling relevan ke pipeline RAG dan alur kerja agen, mengurangi penggunaan token, meminimalkan latensi, dan meningkatkan akurasi." Keluarga BGE Reranker v2 (v2-m3, v2-gemma, v2-minicpm-layerwise) yang diterbitkan BAAI pada Maret 2024 telah menjadi standar di kalangan OSS. ColBERT/ColBERTv2 yang diusulkan oleh Omar Khattab et al. menggunakan pendekatan berbeda yang disebut "late interaction," mencapai kualitas setara BERT dengan FLOPs dua digit lebih rendah dan throughput dua digit lebih cepat, serta dalam ColBERTv2 mengurangi storage footprint sebesar 6-10 kali lipat.

Elemen keempat adalah self-reflection (refleksi diri) dan koreksi diri. Reflection token dari Self-RAG dan confidence scoring dari CRAG berada dalam garis keturunan ini. Dari sisi implementasi, pola conditional edge yang disediakan oleh LangGraph adalah contoh tipikal, di mana node untuk mengevaluasi "apakah hasil pencarian sudah cukup" dan "apakah hasil generasi konsisten secara faktual" disisipkan untuk menjalankan loop pencarian secara dinamis. Pada Adaptive RAG berbasis LangGraph, beberapa benchmark implementasi melaporkan bahwa dengan menggabungkan selective routing dan validasi, halusinasi dapat dikurangi hingga 78% dibandingkan RAG statis.

Elemen kelima adalah Graph RAG (GraphRAG). GraphRAG yang diterbitkan oleh Edge et al. dari Microsoft Research di arXiv:2404.16130, dan merilis v2 pada Februari 2025, melakukan pengindeksan dua tahap: menggunakan LLM untuk membangun knowledge graph entitas dari kumpulan dokumen, kemudian melakukan pre-komputasi deteksi komunitas dan ringkasan komunitas. Dengan ini, untuk kueri bertipe "global sensemaking" (tren keseluruhan atau ringkasan komprehensif) terhadap korpus berskala satu juta token, hasilnya jauh melampaui pure vector RAG dalam hal komprehensivitas dan keragaman. Selain itu, LazyGraphRAG yang diumumkan pada November 2024 berhasil menekan biaya pengindeksan setara dengan vector RAG (0,1% dari GraphRAG penuh), mengurangi biaya kueri menjadi 1/700 dari GraphRAG Global Search sambil mencapai kualitas jawaban yang setara, sekaligus melampaui GraphRAG dalam kedua tipe kueri global dan lokal hanya dengan biaya kueri 4%—mewujudkan keseimbangan antara biaya dan kualitas. LazyGraphRAG telah diintegrasikan ke Microsoft Discovery dan Azure Local sepanjang 2025 dan telah digunakan di tingkat produksi.

Elemen keenam adalah long-term memory (memori jangka panjang) dan manajemen status. Esai *Your harness, your memory* yang diterbitkan Harrison Chase pada April 2026 menegaskan pemisahan antara memori jangka pendek agen (pesan dalam percakapan dan hasil pemanggilan alat yang besar) dengan memori jangka panjang (ingatan lintas sesi), serta gagasan untuk menempatkan manajemen memori di sisi agent harness. Ia mengimplementasikan "working memory berbasis filesystem," "pengungkapan skill bertahap," dan "keamanan berlapis" dalam LangChain Deep Agents, dan dengan tegas mengadvokasi open-source lapisan memori dengan menyatakan bahwa "memilih closed-source berarti kehilangan kendali atas data Anda sendiri." Ini merupakan titik percabangan ideologis yang berseberangan tajam dengan strategi Responses API OpenAI (diumumkan Maret 2025) yang berusaha memonopoli hosted tool primitives (file_search, web_search, function calling), dan menjadi isu sentral dalam diskusi agentic AI tahun 2026.

Biaya implementasi yang mengintegrasikan keenam elemen ini tidaklah ringan di lingkungan produksi tahun 2026. Menurut panduan produksi yang diterbitkan oleh konsultan independen Jahanzaib pada awal 2026, biaya per kueri untuk retrieval standar adalah $0,06–$0,09 (sekitar 9–14 yen), namun untuk Agentic RAG multi-hop yang kompleks, biaya ini melonjak hingga $0,18–$0,31 (sekitar 27–47 yen). Untuk deployment skala menengah, vector store berkisar $50–200 per bulan (sekitar 7.500–30.000 yen), dengan total keseluruhan $2.200–$3.400 per bulan (sekitar 330.000–510.000 yen) sebagai patokan umum, dan target latensi P95 adalah di bawah 2,5 detik. Menambahkan validasi pencarian meningkatkan latensi sebesar 2–3 detik per kueri, namun meningkatkan konsistensi faktual. Dengan menggunakan semantic caching, biaya dapat dikurangi 20–35% untuk workload berulang tinggi; dikombinasikan dengan intelligent routing, biaya workload campuran dapat dikurangi 30–45% dan latensi 25–40%—itulah gambaran umum yang berlaku di lapangan saat ini.

Bab 3 Lapisan Framework/Orkestrasi ―― LangChain, LlamaIndex, CrewAI, dan Microsoft

Persaingan framework untuk mengimplementasikan lapisan aplikasi Agentic RAG mencapai salah satu titik penentuan pada musim gugur 2025. LangChain berhasil mengumpulkan dana sebesar $125 juta (sekitar ¥18,75 miliar) melalui Seri B yang dipimpin oleh IVP pada 20–21 Oktober 2025, dan resmi menjadi unicorn dengan valuasi post-money sebesar $1,25 miliar (sekitar ¥187,5 miliar). Investor yang berpartisipasi antara lain CapitalG, Sapphire Ventures, serta investor strategis seperti ServiceNow Ventures, Workday Ventures, Cisco Investments, Datadog Ventures, dan Databricks Ventures, sementara investor lama Sequoia, Benchmark, dan Amplify turut melakukan investasi tambahan. Seperti yang diungkapkan Harrison Chase dalam podcast Sequoia Capital bertajuk *Context Engineering Our Way to Long-Horizon Agents*, "Implementasi optimal telah berubah secara dramatis—dari simple RAG chain tiga tahun lalu, melalui alur kompleks dengan LangGraph, hingga agent harness." Merespons perubahan ini, LangChain pun menyiapkan portofolio produk tiga lapis: LangChain (framework dasar), LangGraph (orkestrasi berbasis graf), dan LangSmith (observasi & evaluasi), sekaligus merilis LangChain + LangGraph 1.0 bersamaan dengan pengumuman Seri B tersebut. Dalam wawancara dengan majalah Fortune, juru bicara LangChain menyatakan bahwa ARR aktual mereka lebih rendah dari angka yang dilaporkan—yakni "kisaran $12–16 juta (sekitar ¥1,8–2,4 miliar)"—dan menilai angka tersebut "belum mencerminkan kondisi kami saat ini," mengindikasikan bahwa laju pertumbuhan aktual tengah berakselerasi hingga sejajar dengan valuasi $1,25 miliar yang ditetapkan IVP. Deretan nama pelanggan yang ada, seperti Cisco, Replit, Clay, Cloudflare, Workday, dan ServiceNow, menjadi bukti bahwa layanan berbayar untuk observasi dan evaluasi berfungsi efektif sebagai pengait pengadaan enterprise.

LlamaIndex mengumpulkan $19 juta (sekitar ¥2,85 miliar) melalui Seri A yang dipimpin Norwest Venture Partners pada 4 Maret 2025 (dengan partisipasi Greylock, total pendanaan mencapai $27,5 juta / sekitar ¥4,1 miliar), sekaligus meluncurkan LlamaCloud ke tahap GA. Pendiri Jerry Liu dalam blog CEO-nya menyatakan, "LlamaIndex kini bukan sekadar framework RAG, melainkan telah menjadi fondasi Agentic Document Processing," menegaskan pergeseran fokus bisnis dari serba-ada menjadi "infrastruktur dokumen terbaik yang tahan lama." LlamaCloud pun mengintegrasikan berbagai fitur seperti LlamaParse (analisis dokumen) dan AgentWorkflow (knowledge work multi-agen untuk data tidak terstruktur), dengan lebih dari 10.000 organisasi—termasuk lebih dari 90 perusahaan Fortune 500 seperti Salesforce, KPMG, Carlyle, dan Rakuten—yang telah masuk dalam daftar tunggu. Angka 47K bintang GitHub dan 5,2 juta unduhan per bulan (per Maret 2026) membuktikan bahwa posisi sebagai framework khusus dokumen berhasil menciptakan diferensiasi yang jelas dengan LangChain, sang penguasa framework. Dalam newsletter awal 2026, Jerry Liu mengamati bahwa "coding agent (Claude Code, Cursor) semakin terpusat di sekitar filesystem, dan agen beroperasi hanya dengan 5–10 alat inti plus akses filesystem," mengisyaratkan arah desain toolset yang ringan seperti Agent Composer.

CrewAI, yang sepenuhnya berfokus pada pembagian peran multi-agen, mengumpulkan $18 juta (sekitar ¥2,7 miliar) yang dipimpin oleh Insight Partners dan boldstart ventures pada Oktober 2024. ARR yang dikonfirmasi Latka per Juli 2025 adalah $3,2 juta (sekitar ¥480 juta), namun jumlah eksekusi agen yang dijalankan di platform selama 12 bulan terakhir telah melampaui 2 miliar kali, dengan lebih dari 60% perusahaan Fortune 500 diklaim sebagai pelanggan. Arsitektur produknya menggunakan role-based agents with goals and tasks—sebuah kerangka kerja yang menugaskan peran layaknya "marketing researcher," "analis," atau "penulis" dalam struktur organisasi manusia untuk berkolaborasi bersama—dengan tingkat abstraksi yang lebih tinggi dari LangGraph dan kode implementasi yang lebih ringkas. Perusahaan ini telah meluncurkan enterprise cloud ke tahap GA, dengan penekanan pada penempatan lintas cloud AWS/GCP/Azure serta independensi dari vendor LLM.

Haystack, OSS yang dipimpin deepset dari Jerman, tercatat terakhir kali melakukan penggalangan dana besar melalui Seri B senilai $30 juta (sekitar ¥4,5 miliar) yang dipimpin Balderton Capital pada Agustus 2023, dan pada Desember 2025 melakukan rebranding lini produknya menjadi Haystack Enterprise Platform. Dengan menawarkan visual pipeline editor, template, dan dukungan deployment on-premise, perusahaan ini mempertahankan basis pelanggan korporat besar dengan nuansa Eropa yang kuat, termasuk Airbus, The Economist, NVIDIA, dan Comcast. Haystack pun telah mengukuhkan posisinya sebagai pilihan yang memenuhi persyaratan on-premise di sektor manufaktur dan industri pertahanan.

Microsoft mengintegrasikan AutoGen dan Semantic Kernel, lalu merilis Microsoft Agent Framework 1.0 ke produksi pada April 2026 (preview publik pada Oktober 2025, versi resmi pada April tahun berikutnya). Framework ini menggabungkan abstraksi agen dari AutoGen dengan fitur enterprise Semantic Kernel (session state, type safety, middleware, telemetry), dilengkapi dengan orkestrasi workflow berbasis graf, dukungan model multi-provider, serta interoperabilitas lintas runtime A2A dan MCP. AutoGen selanjutnya hanya akan menerima pemeliharaan, sementara pengguna baru diarahkan ke Agent Framework. Konsolidasi Microsoft ini secara praktis menjadikannya harness standar bagi perusahaan yang menggunakan Azure, dan menempatkannya dalam persaingan langsung dengan model bisnis LangChain.

Di ranah pembangun workflow OSS, sejumlah akuisisi besar terjadi berturut-turut pada 2025. Dify asal Tiongkok mengumpulkan pre-A senilai $30 juta (sekitar ¥4,5 miliar) yang dipimpin HSG (Hillhouse), kini menjadi benteng terakhir pemain independen dengan lebih dari 131.000 bintang GitHub dan 280 pelanggan korporat termasuk Maersk dan Novartis. Di sisi lain, Flowise diakuisisi oleh Workday pada Agustus 2025, sementara Langflow diakuisisi oleh DataStax (kini di bawah naungan IBM) lebih awal di tahun yang sama. Skenario yang berulang kali disorot a16z dan Sequoia—"fase ketika pemenang kategori terpapar risiko akuisisi"—kini benar-benar terwujud di lapisan pembangun workflow.

Bab 4 Lapisan Basis Vektor DB/Pencarian ―― Pinecone, Weaviate, Qdrant, Chroma, Turbopuffer

Agar Agentic RAG dapat berjalan secara penuh, diperlukan evolusi besar di balik pencarian vektor. Pergerakan di bidang ini antara tahun 2025 hingga 2026 merupakan salah satu tema investasi infrastruktur terbesar di Silicon Valley.

Pinecone berada di puncak sebagai pemimpin kategori de facto ketika mereka mengumpulkan $100 juta (sekitar ¥15 miliar) pada April 2023 dengan valuasi $750 juta (sekitar ¥112,5 miliar) dalam putaran yang dipimpin a16z, namun mengalami perubahan besar pada tahun 2025 akibat kejaran open source dan hyperscaler. Pendiri Edo Liberty mundur dari posisi CEO ke Chief Scientist pada September 2025, mengumumkan fokus pada "penelitian sistem AI generasi berikutnya berbasis agen." Sebagai CEO baru, diangkat Ash Ashutosh, mantan Global Sales Director Google yang pernah menjabat eksekutif di AppDynamics dan Actifio. Frasa favorit Liberty adalah "dalam 5 tahun ke depan, Vector DB akan bertransformasi dari alat teknis menjadi memori jangka panjang enterprise," yang mengincar posisi baru sebagai pengelola memori jangka panjang agen. Pada Oktober 2025, The Information melaporkan bahwa Pinecone tengah menjajaki penjualan bersama bankir, dengan harga yang diperkirakan di atas $2 miliar (sekitar ¥300 miliar), dan Oracle, IBM, MongoDB, serta Snowflake disebut sebagai calon pembeli. Data Latka menunjukkan pendapatan Pinecone per Desember 2025 sebesar $14 juta (sekitar ¥2,1 miliar) dengan jumlah pelanggan sekitar 4.000 perusahaan, di mana kelipatan ARR terhadap valuasi saat Seri C jelas stagnan. Di sisi produk, mereka mengembangkan Pinecone Assistant sebagai API pembangunan agen, melakukan pembaruan ke arsitektur serverless, sekaligus mulai menyediakan server MCP.

Weaviate belum mengumumkan putaran pendanaan tambahan resmi per April 2026 sejak Seri B senilai $50 juta (sekitar ¥7,5 miliar) yang dipimpin Index Ventures (April 2023, dengan partisipasi Battery Ventures, NEA, Cortical, Zetta, dan ING Ventures), namun selama periode tersebut akselerasi terjadi di sisi produk. Pada Maret 2025, mereka meluncurkan Weaviate Agents secara full-stack, dan pada September tahun yang sama men-GA-kan Query Agent. Struktur internal Query Agent cukup menarik — setelah menerima kueri pengguna, ia menjalankan multi-collection routing, lalu menyelesaikan perluasan & dekomposisi kueri, pembuatan filter, dan re-ranking dalam satu pemanggilan alat tunggal. Ini merupakan abstraksi strategis "menyediakan Agentic RAG melalui satu API," sekaligus desain yang mengeliminasi kebutuhan akan orkestrator eksternal seperti LangGraph. Pada Februari 2026, mereka merilis repositori OSS bernama Weaviate Agent Skills, yang memungkinkan coding agent seperti Claude Code, Cursor, GitHub Copilot, VS Code, dan Gemini CLI menghasilkan kode yang dioptimalkan untuk Weaviate. CEO Bob van Luijt menyatakan, "Kebangkitan Vector DB, layanan embedding vektor, dan arsitektur berbasis agen adalah titik balik dalam evolusi manajemen dan transformasi data," dan pada Januari 2026, Weaviate dinilai sebagai "Leader + Outperformer" oleh GigaOm serta "Emerging Leader" oleh Gartner.

Qdrant yang berbasis di Berlin berhasil mengumpulkan $50 juta (sekitar ¥7,5 miliar) dalam Seri B yang dipimpin AVP (Advance Venture Partners) pada 12 Maret 2026, dengan partisipasi Bosch Ventures, Unusual Ventures, Spark Capital, dan 42CAP, sehingga total pendanaan mencapai sekitar $87,8 juta (sekitar ¥13,17 miliar). Mereka memiliki studi kasus implementasi dari Tripadvisor, HubSpot, OpenTable, Bazaarvoice, dan Bosch, dengan lebih dari 250 juta unduhan dan 29.000 bintang GitHub. Kecepatan implementasi yang ditulis dalam Rust dan positioning "composable vector search" yang berjalan di cloud, on-premise, maupun hybrid sangat cocok dengan perusahaan konservatif asal Eropa.

Chroma mengumpulkan $18 juta (sekitar ¥2,7 miliar) dengan valuasi sekitar $75 juta (sekitar ¥11,25 miliar) dalam Seri B pada 14 Oktober 2025 yang dipimpin Astasia Myers dari Quiet Capital. Dengan desain yang menyatukan pencarian vektor, full-text, regex, dan metadata dalam satu UX developer, Chroma mendapat dukungan dari para pengembang RAG indie dan prototiper aplikasi agen berkat bobotnya yang ringan dan dapat digunakan secara lokal serta embedded.

Milvus/Zilliz belum melakukan penggalangan dana besar sejak Seri B-II senilai $60 juta (sekitar ¥9 miliar) pada Agustus 2022, namun di sisi produk mereka masih mempertahankan mindshare OSS terbesar, dengan bintang GitHub melampaui 40.000 dan lebih dari 10.000 perusahaan yang menggunakannya dalam produksi, termasuk NVIDIA, Salesforce, eBay, Airbnb, dan DoorDash. Pengaruh mereka khususnya besar di pasar Asia.

Di kubu pendatang baru, kebangkitan Turbopuffer menarik perhatian. Perusahaan ini adalah startup berbasis Ottawa yang didirikan bersama oleh Simon Heräp Eskilsen dan Justin Lee, mantan insinyur Shopify, yang mengumpulkan putaran seed dengan jumlah tidak diungkapkan dari Lachy Groom, Thrive Capital, dan beberapa angel investor pada 19 Desember 2025. Perusahaan ini memiliki Anthropic, Atlassian, Cursor, dan Notion sebagai pelanggan, dan menyediakan Vector DB serverless yang memperlakukan object storage seperti S3/GCS/Azure Blob sebagai first-class citizen. Menggunakan indeks SPFresh yang centroid-optimized, mereka mengungguli kompetitor dalam hal biaya per GB pada skala yang sangat besar. Dalam konteks Silicon Valley, fakta bahwa "pengguna infrastruktur AI terdepan seperti Anthropic, Cursor, dan Notion mengadopsinya" itu sendiri berfungsi sebagai tolok ukur. LanceDB juga mengumpulkan $30 juta (sekitar ¥4,5 miliar) dalam Seri A yang dipimpin Theory Ventures pada 24 Juni 2025, memantapkan posisi sebagai "AI-native multimodal lakehouse" di atas format kolumnar Lance.

Jika melihat bidang ini dari sudut pandang engineer, Vector DB tengah terpecah menjadi tiga subkategori. Pertama adalah tipe managed serverless (Pinecone) yang sedang menjajaki penjualan; kedua adalah tipe OSS-first + managed cloud (Weaviate, Qdrant, Chroma, Milvus); dan ketiga adalah tipe object storage-driven (Turbopuffer, LanceDB). Penjajakan penjualan Pinecone dibaca sebagai sinyal bahwa seluruh kategori ini telah memasuki fase "terjepit antara hyperscaler dan OSS."

Bab 5 Platform End-to-End / Berbasis Kontekstual ―― Contextual AI, Cohere, Vectara

Pendekatan untuk menghadirkan Agentic RAG bukan sebagai "kumpulan komponen terpisah" melainkan sebagai "sistem tunggal yang dirancang secara terpadu" paling tajam diwujudkan oleh Contextual AI. Pendirinya, Douwe Kiela, adalah penulis utama makalah RAG Meta tahun 2020 sekaligus dosen tamu di Stanford. Contextual AI berhasil meraih pendanaan Seri A senilai 80 juta dolar (sekitar 12 miliar yen) pada Agustus 2024 yang dipimpin oleh Greycroft, Bain Capital Ventures, Lightspeed, dan Lip-Bu Tan, setelah sebelumnya memperoleh seed funding 20 juta dolar (sekitar 3 miliar yen) pada Juni 2023, sehingga total pendanaan mencapai 100 juta dolar (sekitar 15 miliar yen). Contextual AI Platform yang diluncurkan secara GA pada Januari 2025 didasarkan pada filosofi desain yang disebut RAG 2.0, yang menerapkan joint learning end-to-end secara teroptimasi bersama, alih-alih melatih retriever, re-ranker, dan model generatif (Grounded Language Model) secara terpisah lalu menyambungkannya. Contextual GLM mencapai konsistensi faktual 88% pada benchmark FACTS, melampaui Claude 3.5 Sonnet (79,4%) dan GPT-4o (78,8%) sebagaimana dilaporkan VentureBeat. Pada benchmark RAG mutakhir terbaru, ia mencatat 71,2%, melampaui baseline terkuat (Cohere + Claude 3.5) sebesar 66,8%. Perusahaan ini telah memperoleh pelanggan Fortune 500 seperti HSBC dan Qualcomm, dan pada Januari 2026 meluncurkan Agent Composer yang mengkonversi RAG enterprise menjadi agen produksi. Namun demikian, pendapatan tahunan menurut CB Insights masih berada di kisaran 17,6 juta pound, dengan valuasi yang diperkirakan masih sekitar 150 juta dolar (sekitar 22,5 miliar yen). "Unggul jauh secara teknis namun ARR belum mengimbangi" itulah posisi Contextual AI saat ini, dan tolok ukur putaran pendanaan berikutnya tengah menjadi perhatian.

Cohere adalah perusahaan Kanada berbasis Toronto yang dipimpin oleh CEO Aidan Gomez, salah satu penulis "Attention Is All You Need", dan telah tumbuh pesat sebagai pemimpin LLM enterprise. Pada Agustus 2025, perusahaan ini mencapai valuasi 6,8 miliar dolar (sekitar 1,02 triliun yen) melalui pendanaan 500 juta dolar (sekitar 75 miliar yen) yang dipimpin Radical Ventures/Inovia Capital, kemudian mendorong valuasi ke 7 miliar dolar (sekitar 1,05 triliun yen) melalui second close senilai 100 juta dolar (sekitar 15 miliar yen) pada September, dengan partisipasi dari AMD, NVIDIA, Salesforce Ventures, dan HOOPP. Total pendanaan melampaui 1,6 miliar dolar (sekitar 240 miliar yen). ARR tahun 2025 mencapai 240 juta dolar (sekitar 36 miliar yen), melampaui target awal 200 juta dolar, dan perusahaan ini dipandang sebagai kandidat IPO kuat untuk 2026 setelah merekrut François Chadwick yang berpengalaman dalam IPO sebagai CFO. Produk utamanya meliputi Command A (Maret 2025), model unggulan berparameter 111B dan konteks 256K dengan throughput 150% dibanding Command R+ 08-2024 yang berjalan pada dua GPU A100/H100; Command A Reasoning (Agustus 2025) yang dikhususkan untuk inferensi enterprise; Rerank 3.5 yang mampu melakukan re-ranking lebih dari 100 bahasa dengan konteks 4K; serta "North", platform agen untuk enterprise. Cohere mengakuisisi Ottogrid (sebelumnya Cognosys) pada Mei 2025 dan mengintegrasikan fitur research-agent ke dalam North. Diferensiasi utamanya terletak pada tiga poin: "AI berdaulat (sovereign)", "multibahasa", dan "deployment VPC/on-premise", mempertahankan konfigurasi yang menarik bagi sektor keuangan dan publik dengan regulasi ketat, serta enterprise di Eropa dan Jepang yang membutuhkan dukungan multibahasa.

Vectara mengumpulkan 28,5 juta dolar (sekitar 4,275 miliar yen) pada seed, lalu 25 juta dolar (sekitar 3,75 miliar yen) pada Seri A yang dipimpin FPV Ventures dan Race Capital pada Juli 2024, dengan partisipasi Samsung Next dan Fusion Fund, sehingga total pendanaan berkisar antara 53,5 juta hingga 73,5 juta dolar. Ini merupakan API RAG terintegrasi vertikal yang memiliki LLM khusus pengurangan halusinasi bernama Mockingbird, dengan fokus pada adopsi di industri yang terregulasi. Tidak ada pengumuman pendanaan baru sejak 2025, dan perusahaan ini mempertahankan posisinya sebagai platform implementasi skala kecil.

Bab 6 Agentic RAG Vertikal Terspesialisasi ―― Harvey, Hebbia, Sierra, Decagon, Glean

Sejajar dengan lapisan platform horizontal, "Agentic RAG vertikal" yang mengkhususkan diri pada bidang tertentu berhasil mengumpulkan modal terbesar dari tahun 2025 hingga 2026. Dengan menelusuri model bisnis dan riwayat penggalangan dana masing-masing perusahaan, terlihat jelas di mana VC menempatkan prioritas mereka.

Harvey, yang berspesialisasi di bidang hukum, setelah Seri D pada 2024, berhasil mengumpulkan 300 juta dolar (sekitar 45 miliar yen) pada Juni 2025 dalam Seri E yang dipimpin bersama oleh Kleiner Perkins dan Coatue dengan valuasi 5 miliar dolar (sekitar 750 miliar yen), kemudian 160 juta dolar (sekitar 24 miliar yen) yang dipimpin a16z pada Desember 2025 dengan valuasi 8 miliar dolar (sekitar 1,2 triliun yen), dan pada 25 Maret 2026 mengumpulkan 200 juta dolar (sekitar 30 miliar yen) yang dipimpin bersama oleh GIC dan Sequoia (partisipasi ketiga Sequoia) dengan valuasi 11 miliar dolar (sekitar 1,65 triliun yen). Total penggalangan dana melampaui 1 miliar dolar (sekitar 150 miliar yen). ARR Harvey per Januari 2026 mencapai 190 juta dolar (sekitar 28,5 miliar yen), melonjak 1,9 kali lipat dalam setengah tahun dari 100 juta dolar (sekitar 15 miliar yen) pada Agustus 2025. Pelanggan mencakup mayoritas AmLaw 100, lebih dari 500 tim hukum internal, 50 perusahaan manajemen aset, dan tersebar di 60 negara. Sequoia dalam putaran Maret 2026 mengonfirmasi kembali "defensibilitas kasus penggunaan vertikal Agentic AI," menjadikan Harvey sebagai proksi terpenting Agentic RAG vertikal pada tahun 2026.

Hebbia, yang mengklaim spesialisasi dalam pekerjaan mendalam di bidang keuangan dan hukum, mencapai valuasi 700 juta dolar (sekitar 105 miliar yen) dalam Seri B senilai 130 juta dolar (sekitar 19,5 miliar yen) pada April–Juli 2024 yang dipimpin a16z dengan partisipasi Index Ventures, GV, Peter Thiel, Eric Schmidt, dan Jerry Yang. ARR saat itu sekitar 13 juta dolar (sekitar 1,95 miliar yen) dengan kelipatan 54x. Basis pelanggan mencakup sepertiga manajer aset besar dunia, dengan total AUM sebesar 14 triliun dolar (sekitar 2.100 triliun yen). Produk unggulannya, Matrix, dirancang untuk mengekspresikan secara native proses retrieve-ground-verify multi-agen melalui UI grid spreadsheet, didesain ulang pada Juni 2025, dan pada bulan yang sama mengakuisisi FlashDocs untuk mengintegrasikan fitur pembuatan slide (kini menghasilkan lebih dari 10.000 slide per hari). Hebbia adalah perusahaan yang paling setia mewujudkan tesis a16z tentang "menggantikan pekerjaan mendalam dengan agen AI."

Sierra, yang didirikan oleh Bret Taylor (Ketua OpenAI, mantan Co-CEO Salesforce) dan Clay Bavor (mantan Alphabet), setelah mengumpulkan 175 juta dolar (sekitar 26,25 miliar yen) dengan valuasi 450 juta dolar pada Oktober 2024, pada 4 September 2025 mengumpulkan 350 juta dolar (sekitar 52,5 miliar yen) yang dipimpin Greenoaks Capital dengan valuasi 10 miliar dolar (sekitar 1,5 triliun yen), dengan total penggalangan dana sebesar 635 juta dolar (sekitar 95,25 miliar yen). ARR mencapai 100 juta dolar (sekitar 15 miliar yen) pada November 2025, memperbarui rekor dalam 7 kuartal sejak pendirian, dan memasuki run rate pendapatan tahunan 150 juta dolar (sekitar 22,5 miliar yen) di tahun ketiga. Pelanggan mencakup ratusan perusahaan besar, lebih dari 20% di antaranya memiliki pendapatan di atas 10 miliar dolar. Sierra berfokus pada layanan pelanggan dan unggul dalam alat kalibrasi untuk merek yang dapat mendelegasikan wewenang operasional kepada agen hingga level "mengambil tindakan nyata" seperti pemrosesan pengembalian dana dan penerbitan tiket, dengan kepercayaan pada merek Bret Taylor sebagai faktor diferensiasi yang menonjol.

Decagon mengumpulkan 131 juta dolar (sekitar 19,65 miliar yen) dengan valuasi 1,5 miliar dolar (sekitar 225 miliar yen) dalam putaran yang dipimpin bersama Accel dan a16z pada Juni 2025, dan hanya 7 bulan kemudian pada 28 Januari 2026, mengumpulkan 250 juta dolar (sekitar 37,5 miliar yen) dengan valuasi 4,5 miliar dolar (sekitar 675 miliar yen) yang dipimpin bersama Coatue dan Index Ventures. Valuasi melonjak tiga kali lipat dalam lebih dari setengah tahun, berkat strategi reposisi diri sebagai AI layanan pelanggan sentuhan tinggi yang disebut "AI Concierge." Sepanjang 2025, perusahaan berhasil mendapatkan lebih dari 100 kontrak enterprise baru, dengan partisipasi Bain Capital Ventures, BOND, Ribbit, Forerunner, Avra, A*, ChemistryVC, Definition Capital, dan Starwood Capital dalam putaran Seri D.

Glean, yang memperluas pencarian enterprise ke Agentic AI, setelah Seri E senilai 260 juta dolar (sekitar 39 miliar yen) dengan valuasi 4,6 miliar dolar (sekitar 690 miliar yen) pada September 2024, mengumpulkan 150 juta dolar (sekitar 22,5 miliar yen) dalam Seri F yang dipimpin Wellington Management pada 10 Juni 2025 dengan valuasi 7,2 miliar dolar (sekitar 1,08 triliun yen). Khosla Ventures, Bicycle Capital, Geodesic Capital, dan Archerman bergabung sebagai investor baru, sementara investor yang sudah ada seperti Altimeter, Capital One Ventures, Citi, Coatue, DST, General Catalyst, ICONIQ, IVP, Kleiner Perkins, Latitude, Lightspeed, Sapphire, dan Sequoia melakukan investasi tambahan. Glean menggabungkan konektor SaaS enterprise yang sadar izin, Glean Agents, dan asisten kerja, menjadi contoh representatif dari "agent amplification" yang dibicarakan Reid Hoffman dan sering dikutip di pusat Silicon Valley.

Di segmen vertikal yang sama, Writer.com mengumpulkan 200 juta dolar (sekitar 30 miliar yen) dengan valuasi 1,9 miliar dolar (sekitar 285 miliar yen) pada 12 November 2024 dalam putaran yang dipimpin bersama Premji Invest, Radical Ventures, dan ICONIQ Growth, dengan partisipasi Adobe Ventures, B Capital, Citi Ventures, IBM Ventures, Salesforce Ventures, dan Workday Ventures. Perusahaan ini menawarkan paket vertikal untuk layanan kesehatan, ritel, dan jasa keuangan dengan menggabungkan keluarga LLM Palmyra milik sendiri, RAG berbasis graf, guardrail, dan pembuat agen tanpa kode.

Sana AI, platform LMS/manajemen pengetahuan enterprise, diakuisisi oleh Workday seharga 1,1 miliar dolar (sekitar 165 miliar yen) pada 16 September 2025, tercatat sebagai salah satu akuisisi agen terbesar di bidang ini sepanjang 2025. Demikian pula, Flowrise sebagai pembuat workflow diakuisisi Workday, Langflow diambil alih DataStax (kini IBM), menandai percepatan integrasi Agentic RAG ke dalam sistem internal perusahaan oleh vendor SaaS vertikal.

Bab 7 MCP dan Standardisasi Ekosistem ―― Mengapa Anthropic Menyumbangkan MCP ke Linux Foundation

Insiden arsitektur terbesar tahun 2025 dalam diskusi Agentic RAG adalah standardisasi industri Model Context Protocol (MCP). Ketika Anthropic mempublikasikan MCP pada November 2024, ini hanyalah spesifikasi terbuka dari satu perusahaan, namun pada Maret 2025 OpenAI mengumumkan adopsinya dalam Agents SDK, Responses API, dan ChatGPT desktop, dan pada April tahun yang sama Google DeepMind pun mengikuti. Jumlah unduhan bulanan Python/TypeScript SDK mencapai 97 juta per Maret 2026, dan server MCP yang tersedia untuk publik telah melampaui 10.000. Pada 25 November 2025, dilakukan pembaruan spesifikasi besar-besaran mencakup operasi async, statelessness, identifikasi server, dan registri berbasis komunitas, lalu pada Desember 2025 Anthropic menyumbangkan MCP ke Agentic AI Foundation (AAIF) di bawah naungan Linux Foundation. AAIF didirikan bersama oleh Anthropic, Block, dan OpenAI, dengan dukungan dari Google, Microsoft, AWS, Cloudflare, dan Bloomberg.

Dengan standarisasi MCP, sumbu persaingan dalam Agentic RAG bergeser dari "vector DB mana yang digunakan" menjadi "harness/lapisan kontrol mana yang digunakan". Pinecone menyediakan server MCP, Weaviate Agent Skills berkomunikasi dengan coding agent melalui MCP, Anthropic sendiri menciptakan kondisi di mana ribuan sumber data dapat digunakan melalui MCP, dan baik LangChain maupun Microsoft Agent Framework mengklaim diri sebagai MCP-native. Akibatnya, nilai konektor di sisi sumber data dengan cepat mengalami komoditisasi, dan nilai bergeser ke sisi orkestrasi dan tata kelola data. Forrester memprediksi bahwa 30% vendor aplikasi enterprise akan mempublikasikan server MCP sebelum akhir 2026.

Posisi yang berlawanan dengan ini diambil oleh Responses API dari OpenAI, yang mengadopsi strategi untuk mengendalikan hosted tool primitives (file_search, web_search, function calling) di sisi OpenAI. File_search pada Responses API dikenakan biaya $2,50 (sekitar 375 yen) per 1.000 kueri, penyimpanan $0,10 (sekitar 15 yen) per GB per hari, dan vector store yang baru dibuat mendukung hingga 100 juta file (diperluas dari 10.000 menjadi 100 juta dalam pembaruan November 2025). Assistants API akan dihentikan pada 26 Agustus 2026, dan fungsinya akan diintegrasikan ke dalam Responses API. Pilihan yang dihadapi para engineer sangat jelas: ini adalah persimpangan mengenai hak penentuan nasib sendiri infrastruktur — "apakah akan bergabung dengan ekosistem tertutup seperti OpenAI/Microsoft" atau "memiliki lapisan kontrol sendiri dengan MCP + LangChain/LangGraph/Agent Framework". Pesan Harrison Chase dalam tulisannya *Your harness, your memory* — "jika kamu memilih closed source, kamu kehilangan kendali atas datamu sendiri" — adalah respons tepat terhadap persimpangan inilah.

Bab 8 Alokasi Modal VC Silicon Valley dan Nada Pemberitaan

Dalam total investasi VC tahun 2025, jumlah penggalangan dana terkait AI melonjak lebih dari 75% dari 114 miliar dolar (sekitar 17,1 triliun yen) pada 2024 menjadi lebih dari 202 miliar dolar (sekitar 30,3 triliun yen), mencakup sekitar setengah dari seluruh investasi VC. Dua pemimpin yang paling banyak memimpin kesepakatan kelas unicorn adalah Sequoia (51 kesepakatan / 21 unicorn) dan a16z (50 kesepakatan / 20 unicorn), diikuti oleh Greylock, Benchmark, Kleiner Perkins, IVP, Index Ventures, Accel, Lightspeed, Coatue, Insight Partners, dan General Catalyst yang semuanya terlibat dalam dalam dalam tumpukan Agentic RAG. a16z secara terbuka menyatakan bahwa mereka telah membentuk dana kumulatif lebih dari 15 miliar dolar (sekitar 2,25 triliun yen) pada 2025–26, dan secara mandiri menggerakkan 18% dari total investasi VC Amerika Serikat. Sequoia, bersama SoftBank dan Google Ventures, mengumumkan dana baru senilai 7 miliar dolar (sekitar 1,05 triliun yen) pada April 2026 dan menyatakan akan memperluas investasi AI.

Membaca dokumen pemikiran yang dipublikasikan oleh masing-masing VC, pandangan mereka terhadap Agentic RAG terlihat jelas. Dalam *Big Ideas 2026* yang diterbitkan Januari 2026, a16z memilih "AI Data Transformation Layer" sebagai kategori startup fundamental, menunjukkan bahwa sistem RAG menghadapi "halusinasi akibat sumber informasi yang bertentangan atau usang, dan masalah alur kerja agen yang runtuh secara halus namun berbiaya tinggi," dan berargumen bahwa kualitas data adalah hambatan sesungguhnya. Sequoia dalam *2026: This is AGI* menyatakan "agen bercakrawala jangka panjang secara fungsional adalah AGI, dan 2026 adalah tahunnya," serta dalam *AI in 2026: A Tale of Two AIs* menekankan pergeseran dari copilot menuju agen otonom. Bessemer Venture Partners dalam *AI Infrastructure Roadmap: Five frontiers for 2026* menganalisis bahwa "beban kerja inferensi kini memiliki permintaan komputasi dan kepentingan ekonomi yang setara, bahkan sering melampaui, pelatihan," dan secara eksplisit menyatakan memperhatikan infrastruktur khusus agen seperti TensorMesh (LMCache), RadixArk (perutean SGLang), dan Inferact (vLLM).

Nada pemberitaan di berbagai media juga menunjukkan konvergensi tertentu. TechCrunch melaporkan secara rinci tentang LangChain dalam *Open-source agentic startup LangChain hits $1.25B valuation* pada 21 Oktober 2025, menekankan keyakinan Sequoia terhadap Agentic RAG vertikal dalam *Harvey confirms $11B valuation, Sequoia triples down* pada 25 Maret 2026, dan mengikuti komitmen modal Sequoia dalam *New leaders, new fund: Sequoia has raised $7B to expand its AI bets* pada 16 April 2026. The Information melaporkan lebih awal spekulasi penjualan Pinecone, Bloomberg pada 28 Januari 2026 memberitakan pertumbuhan pesat agen vertikal dalam *AI customer support startup Decagon valued at $4.5 billion*, dan CNBC pada 10 Juni 2025 mengikuti penetrasi agen ke perusahaan besar dalam *Glean raises $150M at $7.2 billion valuation*. Fortune mengungkapkan gambaran ARR LangChain dalam wawancara eksklusif pada 20 Oktober 2025, sementara VentureBeat berulang kali mengangkat hasil benchmark Contextual AI.

Melihat alokasi modal VC tahun 2025–2026, terlihat percabangan yang jelas. Lapisan framework (LangChain, LlamaIndex, CrewAI) menerima modal dalam skala ratusan juta dolar, namun valuasi tetap di kisaran satu hingga dua digit miliar dolar. Lapisan vector DB (Pinecone, Qdrant, Chroma) terus melakukan penggalangan dana berkelanjutan dalam skala 50–100 juta dolar, namun tekanan mulai muncul seiring Pinecone—raja kategori—mempertimbangkan penjualan, terjepit antara OSS dan hyperscaler. Sebaliknya, Agentic RAG vertikal (Harvey, Sierra, Decagon, Hebbia, Glean, Cohere) secara beruntun berhasil mengumpulkan dana ratusan juta hingga miliaran dolar secara individual, dengan valuasi mencapai 4,5–11 miliar dolar. Membandingkan rasio ARR terhadap valuasi pun menunjukkan efisiensi modal sisi vertikal yang jelas lebih tinggi. Ini merupakan bukti bahwa di tengah dominasi OpenAI, Anthropic, dan Google DeepMind atas keunggulan intelektual di sisi platform, VC membaca bahwa nilai ekonomi terbesar akan terakumulasi pada "agen vertikal yang sepenuhnya menguasai operasi bisnis di atas model fondasi."

Perspektif kritis juga muncul secara bersamaan. Dalam siaran pers pada 25 Juni 2025, Gartner memperingatkan bahwa "lebih dari 40% proyek AI agentik akan dibatalkan pada akhir 2027," dengan menyebut kurangnya tata kelola dan observabilitas sebagai penyebab utama. Laporan *State of AI 2025* McKinsey musim gugur 2025 menyatakan bahwa lebih dari 80% enterprise belum merasakan kontribusi pendapatan dari AI generatif, dan kurang dari 10% organisasi berhasil menskalakan agen AI pada fungsi individual. Jason Lemkin dari SaaStr dalam *SaaS Vibe Check* 2025 berulang kali menegaskan "pemenang adalah mereka yang sekaligus pembangun dan pencerita," sekaligus membunyikan alarm bahwa "agen AI produksi tanpa observasi dan evaluasi adalah bom waktu." Fakta yang diungkapkan oleh evaluasi multi-agen Anthropic—"konsumsi token 15 kali lebih tinggi dari obrolan standar"—berulang kali dikutip sebagai angka yang melambangkan permasalahan biaya ini.

Bab 9 Pergerakan Baru yang Diprediksi dari Paruh Kedua 2026 hingga 2027

Dengan mengintegrasikan proyeksi dari berbagai VC, analis, dan lembaga think tank, gambaran pergerakan yang akan terjadi dalam 12–18 bulan ke depan cukup jelas terlihat.

Pertama, persaingan standardisasi memori jangka panjang dan harness agen memasuki fase serius. Lima harness utama — LangChain Deep Agents, Microsoft Agent Framework 1.0, OpenAI Responses API, Anthropic Claude+MCP, dan Databricks Genie Code — akan bersaing memperebutkan posisi sebagai "OS untuk agen" sepanjang akhir 2026 hingga 2027. Meskipun butuh beberapa tahun untuk menentukan pemenangnya, donasi MCP ke Linux Foundation setidaknya telah menetralkan lapisan konektor. Konferensi LangChain yang digelar di San Francisco pada 13–14 Mei 2026 (dengan pembicara Harrison Chase, Jensen Huang, dan Andrew Ng) akan menjadi panggung solidaritas kubu harness open-source.

Kedua, pemimpin kategori vertikal Agentic RAG per industri mulai terbentuk. Harvey (hukum), Hebbia (keuangan), Sierra (layanan pelanggan), Decagon (layanan pelanggan/AI Concierge), Glean (enterprise search), Writer (konten), Spellbook sebagai pesaing Harvey, EvenUp (asuransi & cedera pribadi), Norm Ai (kepatuhan) — masing-masing industri bergerak menuju dominasi tunggal sebagai rujukan Agentic RAG di bidangnya. Sequoia, a16z, Coatue, dan Index Ventures diperkirakan terus berinvestasi di tahap ini untuk mendorong mereka hingga level IPO. Cohere adalah kandidat terdepan untuk IPO, dengan jendela Q2–Q3 2026 masuk dalam radar.

Ketiga, konsolidasi lapisan vector DB semakin cepat. Jika akuisisi Pinecone terwujud, salah satu dari Oracle, IBM, Snowflake, atau MongoDB akan menguasai pemimpin kategori ini, sementara pembagian peran dengan pemain OSS seperti Weaviate, Qdrant, dan Milvus akan semakin jelas. Di sisi lain, jika Turbopuffer atau LanceDB berbasis object storage berhasil berintegrasi secara native dengan Alibaba, AWS, atau Azure, maka "kategori vector DB mandiri" itu sendiri bisa terurai. Apakah visi yang digambarkan Edo Liberty — "vector DB sebagai memori jangka panjang enterprise" — menjadi kenyataan, akan terjawab sebelum 2027.

Keempat, infrastruktur evaluasi dan observabilitas akan tumbuh secara eksplosif. Platform evaluasi dan observasi seperti LangSmith, Arize, Galileo, TruEra, Ragas, Phoenix, dan Braintrust telah terus mengumpulkan pendanaan puluhan juta dolar sejak 2025 hingga 2026. Sebagaimana ditunjukkan oleh peringatan Gartner soal "40% pembatalan", keberhasilan atau kegagalan proyek berbasis agen pada akhirnya bergantung pada kemampuan untuk "mengamati perilaku di lingkungan produksi dan mengelola kualitas secara terukur." Mulai akhir 2026, AI Observability diperkirakan terbentuk sebagai kategori independen dengan ekosistemnya sendiri.

Kelima, perusahaan-perusahaan Jepang diperkirakan mulai memasuki arena Agentic RAG enterprise secara serius. Berbagai laporan mengindikasikan bahwa pemain besar di sektor IT dan telekomunikasi seperti Rakuten, NTT Data, Fujitsu, NEC, KDDI, SoftBank, Mercari, dan LINE Yahoo akan secara beruntun mengumumkan produk Agentic RAG untuk segmen korporasi. Konfigurasi hibrida yang menggabungkan LLM domestik seperti tsuzumi (NTT), Takane (Fujitsu), dan cotomi (NEC) dengan model luar negeri seperti Cohere atau Claude diperkirakan akan menjadi arus utama. Seiring dengan ditetapkannya persyaratan Sovereign AI dalam pengadaan pemerintah, kehadiran vendor seperti Cohere yang mengusung konsep "Sovereign AI" di pasar Jepang berpotensi semakin kuat.

Keenam, protokol interoperabilitas antar agen (Agent-to-Agent, A2A) akan menjadi medan standardisasi berikutnya. Microsoft Agent Framework mengusung interoperabilitas lintas runtime A2A+MCP, diikuti oleh vendor-vendor lain, sementara AAIF (Agentic AI Foundation) berpotensi merumuskan spesifikasi umum di bidang ini. Jika mekanisme pendelegasian dan penugasan tugas antara satu agen ke agen lain berhasil distandarisasi, Agentic RAG akan berevolusi dari "pencarian oleh agen tunggal" menjadi "pencarian oleh ekosistem agen." Fase "koordinasi multi-agen" yang dipaparkan dalam makalah survei Singh et al. kemungkinan baru akan terwujud di level implementasi sekitar tahun 2027.

Bab 10 Penutup ―― Agentic RAG: Dari "Alat Pencarian" Menuju "Infrastruktur Intelektual"

Yang diajarkan oleh modal ventura Silicon Valley per April 2026 adalah fakta bahwa konsep RAG telah melampaui kategori "alat pencarian" dan berevolusi menjadi infrastruktur intelektual itu sendiri dalam lingkungan enterprise. Ramalan pendiri Pinecone, Edo Liberty, yang mengatakan "vector DB akan bertransformasi menjadi memori jangka panjang enterprise"; observasi Matei Zaharia, salah satu pendiri Databricks dan penerima ACM Prize in Computing 2026, yang mengatakan "AGI sudah ada di sini, hanya saja tidak dalam bentuk yang kita evaluasi"; gagasan Harrison Chase yang menyatakan "harness dan memori harus bersifat terbuka"; serta ambisi rekayasa yang diwujudkan Douwe Kiela berupa "pencarian dan generasi yang terintegrasi dalam satu sistem sebagai RAG 2.0" — di titik persilangan semua ini, lapisan infrastruktur yang sedang berjalan bernama Agentic RAG tengah bangkit.

VC Silicon Valley memandang Agentic RAG bukan sekadar subtopik AI, melainkan sebagai pergeseran tektonik yang akan menentukan satu dekade berikutnya dari perangkat lunak enterprise. IVP memberi valuasi USD 1,25 miliar kepada LangChain, Sequoia berinvestasi di Harvey sebanyak tiga kali, a16z memimpin pertumbuhan Hebbia dan Decagon, Coatue terus bertaruh pada agen vertikal, Greycroft/Bain/Lightspeed mendukung RAG 2.0 dari Contextual AI, dan Wellington Management sebagai manajer aset tradisional masuk ke Glean — pola alokasi modal berlapis ini menunjukkan bahwa Agentic RAG adalah tema dengan jangkauan yang sangat luas, melintasi tiga domain sekaligus: "investasi infrastruktur," "investasi aplikasi enterprise," dan "investasi produktivitas."

Di sisi lain, realitas berupa "40% pembatalan" yang diprediksi Gartner, "konsumsi token 15 kali lipat" yang dilaporkan Anthropic, dan "rekam jejak skala di bawah 10%" yang ditunjukkan McKinsey, juga mengisyaratkan bahwa fase penyesuaian antara gelembung dan ekspektasi tak terhindarkan. Dari paruh kedua 2026 hingga 2027, Agentic RAG seharusnya akan matang dari ekspektasi sebagai "sihir yang berjalan di mana saja" menjadi "infrastruktur yang tertanam dalam pada proses bisnis, disertai ROI yang jelas dan observabilitas." Dalam proses tersebut, pemenang dan pecundang akan terpilah dengan jelas. Yang perlu diperhatikan oleh para insinyur Silicon Valley saat ini bukan sekadar pemilihan framework atau vector DB tertentu, melainkan keputusan arsitektur yang lebih mendasar: "di atas lapisan kontrol mana kita akan menempatkan memori jangka panjang perusahaan kita." Ketika kita menengok kembali Agentic RAG pada 2027, kita akan mengingatnya sebagai "titik perubahan di mana filosofi desain aplikasi AI beralih dari model pipeline ke model proses."


Bab 10 Penutup ―― Agentic RAG: Dari "Alat Pencarian" Menuju "Infrastruktur Intelektual"

Yang diajarkan oleh modal VC Silicon Valley per April 2026 adalah fakta bahwa konsep RAG telah melampaui batas "alat pencarian" dan berevolusi menjadi infrastruktur intelektual itu sendiri di dunia enterprise. Ramalan pendiri Pinecone, Edo Liberty, yang mengatakan "Vector DB akan bertransformasi menjadi memori jangka panjang enterprise"; pengamatan Matei Zaharia, co-founder Databricks dan peraih ACM Prize in Computing 2026, yang mengatakan "AGI sudah ada di sini. Hanya saja belum hadir dalam bentuk yang kita evaluasi"; gagasan Harrison Chase yang menyatakan "harness dan memori harus bersifat terbuka"; serta ambisi rekayasa yang diwujudkan Douwe Kiela berupa "pencarian dan generasi yang terintegrasi dalam satu sistem sebagai RAG 2.0" — di titik persilangan semua ini, lapisan infrastruktur yang sedang berkembang bernama Agentic RAG tengah berdiri.

VC Silicon Valley memandang Agentic RAG bukan sekadar subtopik AI, melainkan sebagai pergeseran tektonik yang akan menentukan satu dekade berikutnya dalam perangkat lunak enterprise. IVP memberikan valuasi USD 1,25 miliar kepada LangChain, Sequoia berinvestasi tiga kali di Harvey, a16z memimpin pertumbuhan Hebbia dan Decagon, Coatue terus bertaruh pada agen vertikal, Greycroft/Bain/Lightspeed menopang RAG 2.0 milik Contextual AI, serta Wellington Management — sebagai perusahaan manajemen aset tradisional — masuk ke Glean. Pola alokasi modal berlapis ini menunjukkan bahwa Agentic RAG adalah tema dengan jangkauan yang sangat luas, yang melintasi tiga ranah sekaligus: "investasi infrastruktur", "investasi aplikasi enterprise", dan "investasi produktivitas".

Di sisi lain, realitas berupa "pembatalan 40%" yang diprediksi Gartner, "konsumsi token 15 kali lipat" yang dilaporkan Anthropic, dan "rekam jejak skala di bawah 10%" yang disorot McKinsey juga mengisyaratkan bahwa fase penyesuaian antara gelembung dan ekspektasi tidak terelakkan. Dari paruh kedua 2026 hingga 2027, Agentic RAG seharusnya akan matang dari ekspektasi sebagai "sihir yang bekerja di mana saja" menuju "infrastruktur yang tertanam dalam di proses bisnis, disertai ROI yang jelas dan observabilitas." Dalam proses itu, pemenang dan pecundang akan terlihat jelas. Yang harus dicermati oleh para insinyur Silicon Valley saat ini bukanlah pemilihan framework atau vector DB tertentu, melainkan keputusan arsitektur yang lebih mendasar: "di atas lapisan kontrol mana memori jangka panjang perusahaan kita akan diletakkan." Ketika kita menoleh ke belakang pada Agentic RAG di tahun 2027, kita akan mengingatnya sebagai "titik balik di mana filosofi desain aplikasi AI bergeser dari model pipeline ke model proses."


Sumber

  • Singh, Ehtesham, Kumar, Khoei, Vasilakos, "Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG" (arXiv:2501.09136) — https://arxiv.org/abs/2501.09136
  • Asai et al., "Self-RAG: Learning to Retrieve, Generate, and Critique through Self-Reflection" (arXiv:2310.11511) — https://arxiv.org/abs/2310.11511
  • Yan et al., "Corrective Retrieval Augmented Generation" (arXiv:2401.15884) — https://arxiv.org/abs/2401.15884
  • Jeong, Baek, Cho, Hwang, Park, "Adaptive-RAG" (arXiv:2403.14403) — https://arxiv.org/abs/2403.14403
  • Yao et al., "ReAct: Synergizing Reasoning and Acting in Language Models" (arXiv:2210.03629) — https://arxiv.org/abs/2210.03629
  • Edge et al., Microsoft Research, "From Local to Global: A Graph RAG Approach to Query-Focused Summarization" (arXiv:2404.16130) — https://arxiv.org/abs/2404.16130
  • Microsoft Research, "LazyGraphRAG: Menetapkan Standar Baru untuk Kualitas dan Biaya" — https://www.microsoft.com/en-us/research/blog/lazygraphrag-setting-a-new-standard-for-quality-and-cost/
  • Microsoft Research, Proyek GraphRAG — https://www.microsoft.com/en-us/research/project/graphrag/
  • Microsoft Research, "BenchmarkQED: Pembandingan Otomatis Sistem RAG" — https://www.microsoft.com/en-us/research/blog/benchmarkqed-automated-benchmarking-of-rag-systems/
  • Anthropic Engineering, "Bagaimana Kami Membangun Sistem Riset Multi-Agen" — https://www.anthropic.com/engineering/multi-agent-research-system
  • Anthropic, "Memperkenalkan Contextual Retrieval" — https://www.anthropic.com/news/contextual-retrieval
  • Anthropic, "Memperkenalkan Model Context Protocol" — https://www.anthropic.com/news/model-context-protocol
  • Anthropic, "Mendonasikan Model Context Protocol dan Mendirikan Agentic AI Foundation" — https://www.anthropic.com/news/donating-the-model-context-protocol-and-establishing-of-the-agentic-ai-foundation
  • Spesifikasi Model Context Protocol 2025-11-25 — https://modelcontextprotocol.io/specification/2025-11-25
  • NVIDIA Developer Blog, "RAG Tradisional vs RAG Agentik — Mengapa Agen AI Memerlukan Pengetahuan Dinamis untuk Menjadi Lebih Cerdas" — https://developer.nvidia.com/blog/traditional-rag-vs-agentic-rag-why-ai-agents-need-dynamic-knowledge-to-get-smarter/
  • NVIDIA AI Blueprints, Implementasi Referensi RAG — https://github.com/NVIDIA-AI-Blueprints/rag
  • Cohere, "Rerank" — https://cohere.com/rerank
  • Cohere Docs, "Command A" — https://docs.cohere.com/docs/command-a
  • BAAI, "BGE Reranker v2-m3" — https://huggingface.co/BAAI/bge-reranker-v2-m3
  • Khattab and Zaharia, "ColBERT" (arXiv:2004.12832) — https://arxiv.org/abs/2004.12832
  • OpenAI, "Alat Baru untuk Membangun Agen" — https://openai.com/index/new-tools-for-building-agents/
  • OpenAI, "Alat dan Fitur Baru di Responses API" — https://openai.com/index/new-tools-and-features-in-the-responses-api/
  • OpenAI Developers, "Orkestrasi Alat Responses API" — https://developers.openai.com/cookbook/examples/responses_api/responses_api_tool_orchestration
  • OpenAI Platform Docs, "Panduan Deep Research" — https://platform.openai.com/docs/guides/deep-research
  • Andreessen Horowitz, "Ide-Ide Besar 2026 (Bagian 1)" — https://a16z.com/newsletter/big-ideas-2026-part-1/
  • Andreessen Horowitz, "Kebangkitan Penggunaan Komputer dan Rekan Kerja Agentik" — https://a16z.com/the-rise-of-computer-use-and-agentic-coworkers/
  • Andreessen Horowitz, "Database Vektor dan Kekuatan RAG" — https://a16z.com/podcast/vector-databases-and-the-power-of-rag/
  • Andreessen Horowitz, "Investasi di Hebbia" — https://a16z.com/announcement/investing-in-hebbia/
  • Sequoia Capital, "2026: Inilah AGI" — https://sequoiacap.com/article/2026-this-is-agi/
  • Sequoia Capital, "AI di 2026: Kisah Dua AI" — https://sequoiacap.com/article/ai-in-2026-the-tale-of-two-ais/
  • Sequoia Capital Podcast, "Rekayasa Konteks Menuju Agen Jangka Panjang" (Harrison Chase) — https://sequoiacap.com/podcast/context-engineering-our-way-to-long-horizon-agents-langchains-harrison-chase/
  • Sequoia Capital, "LangChain: Dari Agen 0 ke 1 hingga Rekayasa Agentik" — https://sequoiacap.com/article/langchain-from-agent-0-to-1-to-agentic-engineering/
  • Bessemer Venture Partners, "Peta Jalan Infrastruktur AI: Lima Batas untuk 2026" — https://www.bvp.com/atlas/ai-infrastructure-roadmap-five-frontiers-for-2026
  • Bessemer Venture Partners, "Mengamankan Agen AI" — https://www.bvp.com/atlas/securing-ai-agents-the-defining-cybersecurity-challenge-of-2026
  • Siaran Pers Gartner, "40% aplikasi perusahaan akan menampilkan agen AI khusus tugas pada 2026" — https://www.gartner.com/en/newsroom/press-releases/2025-08-26-gartner-predicts-40-percent-of-enterprise-apps-will-feature-task-specific-ai-agents-by-2026-up-from-less-than-5-percent-in-2025
  • Siaran Pers Gartner, "Lebih dari 40% proyek AI Agentik akan dibatalkan pada akhir 2027" — https://www.gartner.com/en/newsroom/press-releases/2025-06-25-gartner-predicts-over-40-percent-of-agentic-ai-projects-will-be-canceled-by-end-of-2027
  • Gartner, Perkiraan Perangkat Lunak SCM dengan AI Agentik $53 Miliar — https://www.gartner.com/en/newsroom/press-releases/2026-04-07-gartner-forecasts-supply-chain-management-software-with-agentic-ai-will-grow-to-53-billion-in-spend-by-2030
  • McKinsey, "Kondisi Kepercayaan AI 2026: Beralih ke Era Agentik" — https://www.mckinsey.com/capabilities/tech-and-ai/our-insights/tech-forward/state-of-ai-trust-in-2026-shifting-to-the-agentic-era
  • McKinsey, "Memanfaatkan Keunggulan AI Agentik" — https://www.mckinsey.com/capabilities/quantumblack/our-insights/seizing-the-agentic-ai-advantage
  • McKinsey, "Kondisi AI 2025: Agen, Inovasi" — https://www.mckinsey.com/~/media/mckinsey/business%20functions/quantumblack/our%20insights/the%20state%20of%20ai/november%202025/the-state-of-ai-2025-agents-innovation_cmyk-v1.pdf
  • MarketsandMarkets, Laporan Pasar RAG — https://www.marketsandmarkets.com/PressReleases/retrieval-augmented-generation-rag.asp
  • MarketsandMarkets, Pasar Database Vektor — https://www.marketsandmarkets.com/Market-Reports/vector-database-market-112683895.html
  • Grand View Research, Pasar RAG — https://www.grandviewresearch.com/industry-analysis/retrieval-augmented-generation-rag-market-report
  • Fortune Business Insights, Pasar AI Agentik — https://www.fortunebusinessinsights.com/agentic-ai-market-114233
  • LangChain Blog, "Pengumuman Seri B" — https://blog.langchain.com/series-b/
  • TechCrunch, "Startup agentik sumber terbuka LangChain mencapai valuasi $1,25 Miliar" — https://techcrunch.com/2025/10/21/open-source-agentic-startup-langchain-hits-1-25b-valuation/
  • Fortune, "Bintang AI awal LangChain kini menjadi unicorn" — https://fortune.com/2025/10/20/exclusive-early-ai-darling-langchain-is-now-a-unicorn-with-a-fresh-125-million-in-funding/
  • LangChain Blog, "Harness Anda, Memori Anda" — https://www.langchain.com/blog/your-harness-your-memory
  • LangChain Blog, Kemitraan Enterprise NVIDIA — https://blog.langchain.com/nvidia-enterprise/
  • LangChain Newsletter, Maret 2026 — https://www.langchain.com/blog/march-2026-langchain-newsletter
  • TechCrunch, "LlamaIndex meluncurkan layanan cloud untuk membangun agen data tidak terstruktur" — https://techcrunch.com/2025/03/04/llamaindex-launches-a-cloud-service-for-building-unstructed-data-agents/
  • LlamaIndex Blog, "Seri A dan GA LlamaCloud" — https://www.llamaindex.ai/blog/announcing-our-series-a-and-llamacloud-general-availability
  • LlamaIndex Blog, "LlamaIndex Lebih dari Sekadar Framework RAG" — https://www.llamaindex.ai/blog/llamaindex-is-more-than-a-rag-framework
  • PRNewswire, "LlamaIndex Mengamankan Seri A Senilai $19 Juta" — https://www.prnewswire.com/news-releases/llamaindex-secures-19-million-series-a-to-power-enterprise-grade-knowledge-agents-302390936.html
  • Norwest Venture Partners, "LlamaIndex" — https://www.norwest.com/blog/llamaindex-harnesses-the-power-of-enterprise-data-for-ai-agent-workflows/
  • Pulse2, "Platform Multi-Agen CrewAI Mendapatkan Seri A $18 Juta" — https://pulse2.com/crewai-multi-agent-platform-raises-18-million-series-a/
  • Insight Partners, "Kisah ScaleUp AI CrewAI" — https://www.insightpartners.com/ideas/crewai-scaleup-ai-story/
  • Enterprise AI World, CrewAI $18 Juta — https://www.enterpriseaiworld.com/Articles/News/News/$18M-in-Funding-Catapults-CrewAIs-Multi-Agentic-Platform-to-the-Enterprise-Level-166495.aspx
  • deepset, "Pengumuman Pendanaan Balderton Capital" — https://www.deepset.ai/news/funding-announcement-balderton-capital
  • deepset, "Memperkenalkan Platform Enterprise Haystack" — https://www.deepset.ai/blog/introducing-haystack-enterprise-platform
  • Visual Studio Magazine, "Microsoft merilis Agent Framework 1.0 siap produksi" — https://visualstudiomagazine.com/articles/2026/04/06/microsoft-ships-production-ready-agent-framework-1-0-for-net-and-python.aspx
  • Microsoft Learn, "Ikhtisar Agent Framework" — https://learn.microsoft.com/en-us/agent-framework/overview/
  • Visual Studio Magazine, "Semantic Kernel + AutoGen sebagai Agent Framework Microsoft sumber terbuka" — https://visualstudiomagazine.com/articles/2025/10/01/semantic-kernel-autogen--open-source-microsoft-agent-framework.aspx
  • Dify — https://dify.ai/
  • Pinecone Blog, "Seri B" — https://www.pinecone.io/blog/series-b/
  • TechCrunch, "Pinecone mendapatkan investasi $100 Juta pada valuasi $750 Juta" — https://techcrunch.com/2023/04/27/pinecone-drops-100m-investment-on-750m-valuation-as-vector-database-demand-grows/
  • VentureBeat, "Pendiri Pinecone Edo Liberty menunjuk Ash dari Google sebagai CEO" — https://venturebeat.com/data-infrastructure/pinecone-founder-edo-liberty-appoints-googler-ash-as-ceo
  • PRNewswire, Transisi CEO Pinecone — https://www.prnewswire.com/news-releases/pinecone-founder-edo-liberty-to-spearhead-pinecones-growing-ai-ambitions-appoints-ash-ashutosh-as-ceo-to-expand-vector-database-market-leadership-302549334.html
  • Calcalist Tech, Spekulasi penjualan Pinecone — https://www.calcalistech.com/ctechnews/article/rz31q82b5
  • TechTarget SearchDataManagement, Pinecone memandang masa depan — https://www.techtarget.com/searchdatamanagement/news/366631366/Vector-database-vendor-Pinecone-eyes-future-under-new-CEO
  • Pinecone Blog, "Pinecone Assistant Tersedia Secara Umum" — https://www.pinecone.io/blog/pinecone-assistant-generally-available/
  • Weaviate, "Weaviate Seri B" — https://www.prnewswire.com/news-releases/weaviate-raises-50-million-series-b-funding-to-meet-soaring-demand-for-ai-native-vector-database-technology-301803296.html
  • Weaviate, Weaviate Menjadi Full Stack — https://www.globenewswire.com/news-release/2025/03/04/3036570/0/en/Weaviate-Goes-Full-Stack-With-Launch-of-Weaviate-Agents-for-AI-Development.html
  • Weaviate Blog, Query Agent — https://weaviate.io/blog/query-agent
  • Weaviate Blog, Tinjauan tahun 2025 — https://weaviate.io/blog/weaviate-in-2025
  • Weaviate, Peluncuran Agent Skills — https://www.globenewswire.com/news-release/2026/02/21/3242244/0/en/Weaviate-Launches-Agent-Skills-to-Empower-AI-Coding-Agents.html
  • Weaviate, Pengakuan GigaOm Leader / Gartner Emerging Leader — https://www.globenewswire.com/news-release/2026/01/14/3218396/0/en/Weaviate-named-a-Leader-and-Outperformer-by-GigaOm-and-Emerging-Leader-by-Gartner-Market-Momentum-Accelerates-as-Nonrelational-DBMS-Segment-Grows-22-7.html
  • TechCrunch, "Database vektor sumber terbuka Qdrant" — https://techcrunch.com/2024/01/23/qdrant-open-source-vector-database/
  • Qdrant Blog, "Putaran pendanaan Seri A" — https://qdrant.tech/blog/series-a-funding-round/
  • BusinessWire, "Qdrant Meraih Seri B $50 Juta" — https://www.businesswire.com/news/home/20260312313902/en/Qdrant-Raises-$50-Million-Series-B-to-Define-Composable-Vector-Search-as-Core-Infrastructure-for-Production-AI
  • Chroma Company, "Seed" — https://www.trychroma.com/company/seed
  • Medium, "Investasi kami di Chroma (Astasia Myers)" — https://medium.com/memory-leak/our-investment-in-chroma-the-developer-centric-embedding-database-34277ac327e8
  • Salestools, Laporan Seri B Chroma — https://salestools.io/en/report/chroma-raises-18m-series-b
  • TechCrunch, "Zilliz pindah ke SF, mengumpulkan $60 Juta" — https://techcrunch.com/2022/08/24/zilliz-the-startup-behind-the-milvus-open-source-vector-database-for-ai-applications-raises-60m-and-relocates-to-sf/
  • Yahoo Finance, "Milvus melampaui 40.000 bintang GitHub" — https://finance.yahoo.com/news/milvus-surpasses-40-000-github-010000562.html
  • TechCrunch, Spin-out Vespa — https://techcrunch.com/2023/10/04/yahoo-spins-out-vespa-its-search-tech-into-an-independent-company/
  • Vespa.ai, Pendanaan Blossom Capital — https://vespa.ai/2023-11-01-blossom-funding/
  • Tracxn, Profil LanceDB — https://tracxn.com/d/companies/lancedb/__ie1HuEEUoPOIc3tEX5yowY9yMJz9kdNTH01mwCePxLw
  • BetaKit, Turbopuffer mengumpulkan pendanaan — https://betakit.com/ex-shopify-engineers-raise-fresh-financing-to-scale-turbopuffers-ai-search/
  • Turbopuffer, Tentang — https://turbopuffer.com/about
  • SiliconANGLE, Contextual AI mendapat $80 Juta untuk RAG 2.0 — https://siliconangle.com/2024/08/02/contextual-ai-nabs-80m-rag-2-0-platform/
  • Contextual AI Blog, Platform GA — https://contextual.ai/blog/platform-ga-press-release
  • Contextual AI Research, Memperkenalkan RAG 2.0 — https://contextual.ai/research/introducing-rag2
  • VentureBeat, Contextual AI mengungguli GPT-4o — https://venturebeat.com/ai/contextual-ais-new-ai-model-crushes-gpt-4o-in-accuracy-heres-why-it-matters
  • VentureBeat, Contextual AI Agent Composer — https://venturebeat.com/technology/contextual-ai-launches-agent-composer-to-turn-enterprise-rag-into-production
  • Morningstar PRNewswire, Peluncuran Agent Composer — https://www.morningstar.com/news/pr-newswire/20260127sf71236/contextual-ai-launches-agent-composerai-for-when-it-actually-is-rocket-science
  • TechCrunch, "Cohere mencapai valuasi $7 Miliar dan bermitra dengan AMD" — https://techcrunch.com/2025/09/24/cohere-hits-7b-valuation-a-month-after-its-last-raise-partners-with-amd/
  • PSP Investments / Pengumuman pendanaan Cohere — https://www.investpsp.com/en/news/fresh-funding-enables-cohere-to-accelerate-its-global-expansion-and-build-the-next-generation-of-secure-enterprise-and-sovereign-ai-solutions/
  • Futurum Group, "Keunggulan AI Berdaulat Multibahasa Cohere menjelang IPO 2026" — https://futurumgroup.com/insights/coheres-multilingual-sovereign-ai-moat-ahead-of-a-2026-ipo/
  • InfoWorld, "Cohere beralih ke AI Agentik" — https://www.infoworld.com/article/3757962/cohere-goes-north-with-agentic-ai.html
  • Vectara Seri A, BusinessWire — https://www.businesswire.com/news/home/20240716489550/en/Vectara-Secures-%2425-Million-Series-A-Funding-to-Advance-the-Trustworthiness-of-Retrieval-Augmented-Generation-with-New-Mockingbird-LLM
  • Glean, Seri F $150 Juta — https://www.glean.com/press/glean-raises-150m-series-f-at-7-2b-valuation-to-accelerate-enterprise-ai-agent-innovation-globally
  • TechCrunch, Glean valuasi $7,2 Miliar — https://techcrunch.com/2025/06/10/enterprise-ai-startup-glean-lands-a-7-2b-valuation/
  • CNBC, Glean Seri F $150 Juta — https://www.cnbc.com/2025/06/10/glean-gen-ai-search-startup-raises-150-million-at-7-billion-value.html
  • TechCrunch, Perplexity $200 Juta pada valuasi $20 Miliar — https://techcrunch.com/2025/09/10/perplexity-reportedly-raised-200m-at-20b-valuation/
  • Writer.com, Pengumuman Seri C — https://writer.com/blog/series-c-funding-writer-press-release/
  • TechCrunch, Writer $200 Juta pada valuasi $1,9 Miliar — https://techcrunch.com/2024/11/12/generative-ai-startup-writer-raises-200m-at-a-1-9b-valuation/
  • TechCrunch, Hebbia Seri B $130 Juta — https://techcrunch.com/2024/07/09/ai-startup-hebbia-rased-130m-at-a-700m-valuation-on-13-million-of-profitable-revenue/
  • Hebbia Blog, Seri B — https://www.hebbia.com/blog/hebbia-raises-usd130m-series-b
  • TechCrunch, Harvey valuasi $11 Miliar — https://techcrunch.com/2026/03/25/harvey-confirms-11b-valuation-sequoia-triples-down/
  • CNBC, Harvey $200 Juta pada valuasi $11 Miliar — https://www.cnbc.com/2026/03/25/legal-ai-startup-harvey-raises-200-million-at-11-billion-valuation.html
  • Harvey, Pengumuman Seri — https://www.harvey.ai/blog/harvey-raises-at-dollar11-billion-valuation-to-scale-agents-across-law-firms-and-enterprises
  • TechCrunch, Harvey valuasi $8 Miliar Desember 2025 — https://techcrunch.com/2025/12/04/legal-ai-startup-harvey-confirms-8b-valuation/
  • TechCrunch, Bret Taylor Sierra $350 Juta pada valuasi $10 Miliar — https://techcrunch.com/2025/09/04/bret-taylors-sierra-raises-350m-at-a-10b-valuation/
  • TechCrunch, Sierra ARR $100 Juta — https://techcrunch.com/2025/11/21/bret-taylors-sierra-reaches-100m-arr-in-under-two-years/
  • CNBC, Sierra valuasi $10 Miliar — https://www.cnbc.com/2025/09/04/bret-taylor-sierra-ai-startup-salesforce-openai.html
  • Decagon Blog, Pengumuman Seri D — https://decagon.ai/blog/series-d-announcement
  • Bloomberg, Decagon valuasi $4,5 Miliar — https://www.bloomberg.com/news/articles/2026-01-28/ai-customer-support-startup-decagon-valued-at-4-5-billion
  • Decagon Blog, Seri C — https://decagon.ai/resources/series-c-announcement
  • BusinessWire, Decagon Seri D — https://www.businesswire.com/news/home/20260128580542/en/Decagons-Valuation-Triples-to-$4.5-Billion-as-it-Ushers-in-the-Age-of-AI-Concierge
  • Sana Labs, Pengumuman Seri B — https://sanalabs.com/resources/announcing-sanas-series-b-round
  • Sana Labs, Perluasan Seri B — https://sanalabs.com/resources/sana-reaches-62m-dollars-in-series-b-funding
  • You.com, Pengumuman Seri C — https://you.com/resources/series-c
  • TechStartups, Valuasi You.com $1,5 Miliar — https://techstartups.com/2025/09/04/you-com-raises-100m-series-c-in-funding-at-1-5b-valuation-to-scale-ai-search-infrastructure/
  • TechCrunch, Databricks $4 Miliar pada valuasi $134 Miliar — https://techcrunch.com/2025/12/16/databricks-raises-4b-at-134b-valuation-as-its-ai-business-heats-up/
  • Databricks, Akuisisi MosaicML — https://www.databricks.com/company/newsroom/press-releases/databricks-completes-acquisition-mosaicml
  • Databricks Blog, Genie Code — https://www.databricks.com/blog/introducing-genie-code
  • Databricks, Peluncuran Agent Bricks — https://www.databricks.com/company/newsroom/press-releases/databricks-launches-agent-bricks-new-approach-building-ai-agents
  • TechCrunch, Matei Zaharia memenangkan Hadiah Komputasi ACM — https://techcrunch.com/2026/04/08/databricks-matei-zaharia-wins-acm-computing-prize-agi/
  • TechCrunch, Sequoia mengumpulkan $7 Miliar untuk AI — https://techcrunch.com/2026/04/16/new-leaders-new-fund-sequoia-has-raised-7b-to-expand-its-ai-bets/
  • Catatan Rilis Snowflake, Cortex Agents GA — https://docs.snowflake.com/en/release-notes/2025/other/2025-11-04-cortex-agents
  • Snowflake, Ikhtisar Cortex — https://www.snowflake.com/en/product/features/cortex/
  • Snowflake, Cortex Code — https://www.snowflake.com/en/product/features/cortex-code/
  • SaaStr, "Pemeriksaan Kondisi SaaS 2025 bersama Jason Lemkin" — https://www.saastr.com/the-2025-saas-vibe-check-what-founders-need-to-know-right-now-with-saastr-ceo-and-founder-jason-lemkin/
  • Jahanzaib.ai, "Panduan Produksi Agentic RAG" — https://www.jahanzaib.ai/blog/agentic-rag-production-guide
  • Suprmind, "Tingkat Halusinasi AI dan Tolok Ukur" — https://suprmind.ai/hub/ai-hallucination-rates-and-benchmarks/