Ringkasan

"Kiat kerja" (pengetahuan tasit) yang hanya ada di kepala karyawan berpengalaman akan diserap oleh AI dari operasi layar, video rekaman, dan log kerja yang dikumpulkan secara terus-menerus, lalu ditranskripsikan secara otomatis menjadi Prosedur Operasi Standar (SOP). Lebih jauh lagi, agen AI itu sendiri membaca prosedur tersebut, menggerakkan sistem internal perusahaan secara langsung, dan menyelesaikan pekerjaan. Tumpukan teknologi (stack) baru yang terdiri dari empat lapisan ini—Screen-to-SOP, Video-to-SOP, Passive Capture, dan Agentic SOP—sedang berkembang pesat pada paruh pertama tahun 2026. Artikel ini merangkum produk-produk representatif dari keempat bidang tersebut untuk pemula, lalu menjelaskan secara terpadu bagaimana VC papan atas Silicon Valley menafsirkan hal ini dan bagaimana mereka mengalirkan dananya.


Gambaran besar pipeline pembuatan SOP yang digambarkan oleh 4 bidang

Per Mei 2026, pasar AI seputar prosedur operasi standar (SOP, Standard Operating Procedure) kini mulai dipahami sebagai sebuah "pipeline" yang terdiri dari empat lapisan yang saling terhubung. Yang berada paling hilir adalah Screen-to-SOP, yang mengamati satu per satu operasi layar yang dikerjakan oleh para ahli setiap hari, lalu langsung menghasilkan panduan prosedur langkah demi langkah. Berikutnya adalah Video-to-SOP, yang menganalisis secara susulan rekaman video atau rapat Zoom yang telah terkumpul di masa lalu, lalu mentranskripsinya menjadi SOP berbasis teks. Lebih ke hulu lagi terdapat Passive Capture, yang terus-menerus menyerap data di sekitar bahkan saat pengguna bekerja tanpa menyadarinya, dan membangun knowledge graph dari catatan kerja mentah yang "tidak tertulis dalam manual resmi", seperti isi email, tiket dukungan, percakapan Slack, dan riwayat penyuntingan berkas. Dan yang terakhir, Agentic SOP, adalah lapisan tempat panduan prosedur yang telah diekstraksi seperti itu langsung "dibaca dan dijalankan" oleh agen AI.

Keempat lapisan ini bukanlah hubungan persaingan, melainkan justru hubungan yang saling melengkapi. Screen-to-SOP dan Video-to-SOP sama-sama membuat panduan prosedur dengan bertitik tolak dari operasi "merekam" yang eksplisit, sedangkan Passive Capture adalah mekanisme yang mengumpulkan informasi tanpa karyawan perlu menekan tombol rekam, sehingga volume pengetahuan yang menjadi dasarnya jauh lebih besar berkali-kali lipat. Dan Agentic SOP berada di sisi yang mengonsumsi "deskripsi kerja yang dapat dibaca mesin" yang dihasilkan oleh ketiga lapisan tersebut. Seperti yang berulang kali ditekankan oleh Sonya Huang dan Pat Grady, partner di Sequoia Capital, dalam pidato utama AI Ascent 2026 pada April 2026, rangkaian aliran ini melambangkan transisi dari era ketika "perangkat lunak hanya menggambarkan" menuju era ketika "perangkat lunak menyerahkan pekerjaan yang telah selesai sebagai hasil kerja". Mereka menyebut pasar ini sebagai "Services-as-a-Software" dan berpendapat bahwa pasar jasa global (diperkirakan 10 triliun dolar AS, setara sekitar 1.550 triliun yen) akan terbuka bagi perusahaan agen AI sebagai TAM yang lebih dari sepuluh kali lipat dibandingkan pasar perangkat lunak konvensional (sekitar 600 miliar dolar AS per tahun, setara sekitar 93 triliun yen).

Berikut ini, kami akan menggali isi dari masing-masing keempat bidang tersebut melalui produk dan skenario penggunaan yang konkret.


Screen-to-SOP — Dari penangkapan operasi layar secara real-time hingga pembuatan manual otomatis

Screen-to-SOP merupakan kategori dengan sejarah terpanjang dan telah meraih kesuksesan komersial yang besar. Pengguna cukup mengoperasikan sistem kerja seperti biasa, lalu ekstensi browser atau aplikasi desktop yang berjalan permanen akan merekam setiap klik, scroll, dan input teks secara berurutan, dan begitu tombol selesai ditekan, hasilnya langsung dikeluarkan sebagai dokumen prosedur yang dilengkapi tangkapan layar. Akan lebih mudah dibayangkan jika dikatakan bahwa staf akuntansi cukup mengoperasikan 30 langkah penerbitan faktur dengan klik demi klik, lalu "Manual Penerbitan Faktur ver.2026-05" akan otomatis dibuat.

Pemimpin industri de facto di bidang ini adalah Scribe yang berbasis di San Francisco. Pada 10 November 2025, perusahaan tersebut menggalang dana sebesar 75 juta dolar AS (sekitar 11,6 miliar yen) dalam putaran Seri C yang dipimpin oleh StepStone Group, dengan valuasi pasca-pendanaan mencapai 1,3 miliar dolar AS (sekitar 201,5 miliar yen). Investor lama seperti Amplify Partners, Redpoint Ventures, Tiger Global, Morado Ventures, dan New York Life Ventures juga ikut menambah suntikan dana. Menurut pemberitaan TechCrunch pada 10 November 2025, Scribe mengumumkan produk baru "Scribe Optimize" pada saat total dana yang digalangnya mencapai sekitar 150 juta dolar AS (sekitar 23,3 miliar yen). Optimize tidak sekadar menghasilkan dokumen prosedur, tetapi secara berkelanjutan menambang alur kerja karyawan di cloud, lalu memvisualisasikan duplikasi pekerjaan, pengerjaan ulang, serta hotspot kandidat untuk otomatisasi. Jika produk lama perusahaan tersebut (yang kini telah di-rebrand menjadi "Scribe Capture") adalah produk yang "membuat dokumen prosedur individual", maka Optimize adalah produk yang "menggambar peta kerja seluruh organisasi dan menyajikan usulan perbaikan", dan gerakan Scribe untuk bertransformasi dari sekadar alat SOP bervaluasi lebih dari 1 miliar dolar AS menjadi platform process intelligence yang lebih besar terlihat jelas. Saat ini Scribe hanya mendukung aplikasi SaaS berbasis browser, tetapi dalam roadmap-nya perusahaan menyatakan secara tegas akan melakukan ekspansi ke aplikasi legacy seperti mainframe dan aplikasi berbasis function key.

Yang dikenal luas sebagai pemain kedua setelah Scribe adalah Tango, yang kantor pusatnya juga berada di San Francisco. Didirikan pada 2020, perusahaan ini menggalang dana seed sebesar 5,7 juta dolar AS (sekitar 880 juta yen) pada Agustus 2021 yang dipimpin oleh Wing VC, dan 14 juta dolar AS (sekitar 2,2 miliar yen) pada Seri A bulan Juni 2022 yang dipimpin oleh Tiger Global, sehingga total dana yang terkumpul sekitar 19,7 juta dolar AS (sekitar 3,05 miliar yen). Cirinya adalah berkumpulnya VC dengan warna strategis yang kuat seperti General Catalyst, Slack Fund, Atlassian Ventures, dan GSV Ventures, dan menurut data PitchBook serta Crunchbase, per Mei 2026 produk ini disebut masih digunakan oleh 25.000 tim. Poin diferensiasi Tango adalah dokumen prosedur yang dihasilkan dapat di-overlay kembali ke layar kerja aktif dalam mode "Guide Me", sehingga ketika karyawan baru mengoperasikan sesuai instruksi, panduan hands-on akan berjalan secara real-time. Sementara Scribe memiliki kekuatan dalam "penataan basis pengetahuan yang statis", Tango lebih condong ke "panduan instan di lapangan (Digital Adoption)", dan kedua perusahaan ini de facto membentuk struktur duopoli.

Dalam segmen ini, kekuatan lama yang telah lama eksis untuk segmen enterprise juga berupaya melakukan pembalikan keadaan. Whatfix, yang berbasis di India dan San Francisco, menggalang dana 125 juta dolar AS (sekitar 19,4 miliar yen) dalam Seri E bulan September 2024, dengan total dana terkumpul lebih dari 139 juta dolar AS (sekitar 21,5 miliar yen). Pada 2026 mereka meluncurkan kelompok agen yang disebut "Authoring Agent", "Guidance Agent", dan "Insights Agent", lalu beralih menjadi DAP (Digital Adoption Platform) bertipe agen di mana AI terus-menerus menulis ulang panduan secara otomatis pada UI yang langsung ditumpangkan pada layar operasi sistem kerja. Di sisi lain, WalkMe asal AS yang selama bertahun-tahun menjadi rival Whatfix, sejak diakuisisi oleh SAP seharga sekitar 1,5 miliar dolar AS (sekitar 232,5 miliar yen) pada 2024, telah mengarahkan haluannya ke optimalisasi ekosistem SAP, sehingga kehadirannya sebagai pemain "Screen-to-SOP" yang independen semakin memudar.

Adapun skenario penggunaan yang khas adalah lingkungan kerja seperti: (1) penulisan ulang manual secara menyeluruh seiring dengan peningkatan versi ERP atau CRM, di mana dengan menggunakan Scribe pekerjaan yang sebelumnya memakan waktu satu minggu dapat diselesaikan dalam setengah hari; (2) pelatihan karyawan baru di call center, di mana dengan panduan yang ditumpangkan Tango pada layar, "pelatihan yang sebelumnya memakan waktu 2 minggu menjadi 3 hari"; (3) tempat kerja seperti administrasi medis atau loket pemerintahan yang harus me-reset prosedur kerja setiap kali ada mutasi personel, di mana Whatfix secara instan menyusun ulang "dokumen prosedur kustom untuk masing-masing lapangan" melalui agen.


Video-to-SOP — Mentranskripsi video rekaman yang sudah ada menjadi prosedur kerja

Video-to-SOP sekilas mirip dengan Screen-to-SOP, tetapi ada perbedaan yang sangat mendasar. Ia tidak memerlukan perekaman baru untuk membuat panduan prosedur, dengan kata lain ini adalah mekanisme untuk menyelamatkan pengetahuan dari aset video yang "sudah terlanjur direkam". Video pelatihan, rapat internal yang direkam lewat Zoom, tutorial untuk UKM (usaha kecil dan menengah) yang dibiarkan begitu saja di YouTube — konten video semacam ini meledak jumlahnya selama 10 tahun terakhir, tetapi sebaliknya tingkat keterlacakannya sangat rendah sehingga sebagai pengetahuan praktis berada dalam kondisi nyaris "terkubur". Berkat penerapan praktis LLM multimodal, kini dimungkinkan untuk membaca teks dan elemen UI yang tampil di layar, mencocokkannya dengan narasi, dan menghasilkan panduan prosedur yang terstruktur, sehingga penyelamatan pengetahuan yang terkubur ini berlangsung pesat sekaligus.

Pendanaan yang paling banyak menarik perhatian dalam kategori ini pada tahun 2026 adalah Guidde, yang memiliki kantor di Tel Aviv dan San Francisco. Pada 25 Februari 2026, Guidde mengumumkan telah merampungkan pendanaan Seri B senilai 50 juta dolar AS (sekitar 7,7 miliar yen) yang dipimpin oleh PSG Equity dari AS. Menurut laporan CTech, ronde tersebut diikuti oleh monday.com yang merupakan SaaS manajemen tugas, investor lama Norwest, Entrée Capital, Qualcomm Ventures, dan Inkberry Ventures. Platform Guidde memiliki ciri khas: cukup dengan karyawan menjalankan pekerjaan sehari-hari seperti biasa, AI akan secara bersamaan menganalisis rekaman layar dan narasi, lalu secara otomatis menghasilkan baik video penjelasan bersubtitel maupun SOP berbasis teks. Per awal tahun 2026, perusahaan ini mengumumkan memiliki lebih dari 4.500 pelanggan termasuk Anheuser-Busch, Bayer, Nasdaq, Yahoo, dan SentinelOne, dengan pertumbuhan pendapatan tahunan tiga kali lipat selama tiga tahun berturut-turut, serta tingkat retensi pelanggan di atas 90%. Dana kali ini disebut akan dialokasikan untuk memperluas kemitraan implementasi dengan firma akuntansi global seperti KPMG dan Deloitte, yang menyiratkan strategi untuk menembus jauh ke dalam proyek transformasi TI perusahaan-perusahaan besar di Jepang, Amerika, dan Eropa.

Selain Guidde, pemain Video-to-SOP yang spesialis pun bermunculan satu demi satu. Trupeer asal India berfokus pada penghasilan secara bersamaan antara "video penjelasan yang dipoles" dan "SOP berbasis teks" dari video rekaman, dan dihargai karena output-nya yang terlihat rapi dengan templat yang sesuai dengan merek. Clueso memiliki keunggulan dalam pengolahan AI untuk pascaproduksi seperti zoom otomatis, penghilangan derau, dan pembersihan skrip, sedangkan Vidocu adalah tipe satu sumber multi-output yang cukup dengan mengunggah satu video langsung menghasilkan subtitel, sulih suara (lebih dari 65 bahasa), artikel beserta tangkapan layar, dan video yang sudah diedit sekaligus. Lebih jauh lagi, Video-to-SOP dari Docsie menekankan poin bahwa ia mengenali teks dan elemen UI di dalam video melalui pengenalan citra, mencocokkannya dengan narasi, dan menafsirkan secara semantik "untuk tujuan apa apa diklik".

Loom dahulu bermula sebagai "alat perekam layar untuk perorangan", tetapi sejak diakuisisi oleh Atlassian pada tahun 2023 senilai 975 juta dolar AS (sekitar 151 miliar yen), ia terintegrasi mendalam ke dalam ekosistem pengetahuan Atlassian. Loom AI per tahun 2026 tidak hanya secara otomatis menghasilkan judul, ringkasan, bab, dan item tindakan dari rekaman, tetapi juga dilengkapi dengan lima jenis templat yaitu SOP, panduan langkah demi langkah, langkah QA, deskripsi PR, dan dokumen penjelasan kode, serta dapat mengirim hasil generasinya ke tiket Jira atau halaman Confluence hanya dengan sekali klik. Tingkat harga untuk kalangan enterprise juga mencakup tampilan administrator global serta integrasi native dengan Confluence/Jira, sehingga organisasi yang selama ini memandang Loom sekadar sebagai alat video pesan kini mulai mengadopsinya kembali sebagai basis utama SOP internal.

Yang khas sebagai skenario penggunaan adalah proyek-proyek seperti: (1) menyalin secara sekaligus kumpulan video validasi GxP perusahaan farmasi menjadi SOP terstruktur, sehingga memangkas jam kerja untuk menanggapi audit dari otoritas regulasi; (2) departemen pengendalian mutu di kantor pusat menstandarkan "video penataan kerja di lapangan" yang direkam oleh pekerja ahli industri manufaktur menggunakan kacamata pintar melalui Video-to-SOP; (3) firma konsultan mengubah rekaman lokakarya klien di masa lalu menjadi pustaka metodologi yang tersistematisasi. Alasan Guidde bekerja sama dengan firma akuntansi besar tidak lain karena justru kasus penggunaan nomor 3 inilah yang sangat menarik sebagai bisnis kekayaan intelektual milik KPMG maupun Deloitte sendiri.

Passive Capture — Menyerap pengetahuan tersirat di latar belakang

Passive Capture memiliki ambisi yang lebih filosofis dibandingkan dengan Screen-to-SOP atau Video-to-SOP. Konsepnya adalah membangun "kapal induk pengetahuan tasit" untuk seluruh organisasi dengan terus-menerus menyerap segala peristiwa kerja seperti email, Slack, Teams, tiket dukungan, komentar CRM, penyuntingan berkas, hingga rekaman rapat — tanpa karyawan perlu melakukan operasi sadar apa pun seperti "menekan tombol rekam" atau "mengunggah video". Seperti yang ditunjukkan oleh artikel "Tacit Knowledge Is Your Next Competitive Moat" yang dimuat California Management Review pada Maret 2026, keunggulan kompetitif di era agen telah bergeser bukan lagi pada data ataupun model, melainkan pada pengetahuan tasit yang tertanam dalam penilaian (judgment) para karyawan.

Penggalangan dana yang paling banyak dibicarakan dalam kategori ini sepanjang 2026 adalah Interloom yang berbasis di Munich. Sebagaimana diberitakan secara eksklusif oleh Fortune pada 23 Maret 2026, Interloom mengamankan pendanaan tahap seed sebesar 16,5 juta dolar AS (sekitar 2,6 miliar yen). Investor utamanya adalah DN Capital, dengan partisipasi dari Bek Ventures dan Air Street Capital. Perusahaan ini sebelumnya telah menggalang dana pre-seed sebesar 3 juta dolar AS (sekitar 460 juta yen) pada Maret 2024, sehingga totalnya mencapai sekitar 20 juta dolar AS (sekitar 3,1 miliar yen). Produk Interloom menyerap "catatan yang secara alami muncul di tengah pekerjaan" — seperti email dukungan, tiket layanan, transkripsi pusat panggilan, dan perintah kerja (work order) — dalam satuan jutaan, lalu terus memperbarui graf konteks tentang "bagaimana suatu masalah selama ini diselesaikan di lapangan", layaknya Google Maps yang mempelajari rute tercepat dari volume lalu lintas. Perusahaan ini telah diadopsi secara produksi di Commerzbank, salah satu bank terbesar Jerman, di mana ia mempersempit kesenjangan antara manual tertulis dan pengetahuan operasional nyata di lapangan dari sekitar 50% menjadi 5%; di Volkswagen untuk mengotomatiskan penanganan awal tiket dukungan; dan di Zurich Insurance untuk mengotomatiskan pekerjaan penjaminan (underwriting).

Di sisi AS, yang membidik posisi serupa adalah Workhelix yang didirikan oleh Eric Brynjolfsson dari Stanford dan kawan-kawan. Perusahaan ini menggalang dana 15 juta dolar AS (sekitar 2,3 miliar yen) dalam putaran Seri A pada Februari 2025 yang dipimpin AIX Ventures. Turut tercantum nama AI Fund milik Andrew Ng, Accenture Ventures, Bloomberg Beta, serta para angel investor seperti salah satu pendiri LinkedIn Reid Hoffman, salah satu pendiri OpenAI yang kini menjabat CEO Thinking Machines Lab Mira Murati, dan Jeff Dean dari Google DeepMind. Pendekatan Workhelix adalah memecah pekerjaan perusahaan ke tingkat tugas yang berjumlah lebih dari 250.000, lalu memberi skor untuk masing-masing tentang "apakah dapat digantikan oleh AI" dan "seberapa besar peningkatan produktivitas yang dapat diharapkan jika digantikan". Pada dasarnya, ini adalah layanan yang mengonversi "objek-objek pekerjaan yang menjadi dapat diamati berkat Passive Capture" menjadi peta jalan penerapan AI. Pelanggan seperti Accenture, Wayfair, dan Coursera telah tercatat sejak tahap awal.

Yang melambangkan Passive Capture melalui perangkat keras adalah Limitless, yang sebelumnya bernama Rewind AI. CEO-nya, Dan Siroker, adalah seorang serial entrepreneur yang dikenal sebagai pendiri Optimizely, dan perusahaan ini telah menggalang dana lebih dari total 33 juta dolar AS (sekitar 5,1 miliar yen) dari a16z. Perusahaan ini beroperasi melalui dua lini: aplikasi "Rewind" yang terus-menerus merekam layar dan suara desktop Mac lalu memunculkannya kembali sebagai memori yang dapat dicari, dan perangkat keras berbentuk liontin "Limitless pendant" seharga 99 dolar AS (sekitar 15.000 yen) yang dikalungkan di leher. Namun, menurut pemberitaan CNBC, TechCrunch, dan SF Standard tertanggal 5 Desember 2025, pada hari yang sama Meta mengumumkan akuisisi (nilai akuisisi tidak diungkap). Meta mengumumkan akan menghentikan bisnis pendant, dan aplikasi desktop "Rewind" juga akan menghentikan sepenuhnya fitur perekaman layar dan suara mulai 19 Desember 2025. Hal ini dianggap sebagai langkah simbolis di mana Passive Capture yang paling radikal — yakni perekaman terus-menerus — diserap ke dalam Big Tech, bukan oleh startup independen.

Dalam kategori yang menyediakan Passive Capture sebagai perpanjangan dari pencarian pengetahuan, Glean mencatat lonjakan valuasi yang luar biasa. Perusahaan ini mengumumkan putaran Seri E senilai 260 juta dolar AS (sekitar 40,3 miliar yen) yang dipimpin Altimeter dan DST Global pada Januari 2026, dengan valuasi 4,6 miliar dolar AS (sekitar 713 miliar yen). Sekitar 9 bulan kemudian, masih dalam tahun 2026, perusahaan ini menggalang tambahan 150 juta dolar AS (sekitar 23,3 miliar yen) dalam putaran Seri F yang dipimpin Wellington Management, sehingga valuasinya melonjak hingga 7,2 miliar dolar AS (sekitar 1,1 triliun yen). Glean berawal dari pencarian enterprise yang secara otomatis mengindeks informasi kerja yang tersebar di berbagai SaaS dan basis data, sehingga karyawan cukup bertanya "dokumen itu untuk proyek itu" untuk langsung menarik bagian yang relevan. Namun pada 2026, TechCrunch memberitakan bahwa perusahaan ini menargetkan diri sebagai "lapisan terpadu yang berjalan di balik aplikasi". Otter.ai juga berawal dari transkripsi notula rapat, dan pada Maret 2025 pendapatan berulang tahunannya (ARR) melampaui 100 juta dolar AS (sekitar 15,5 miliar yen). Pada 28 April 2026, perusahaan ini mengumumkan platform baru yang disebut Conversational Knowledge Engine, melangkah ke arah merajut ucapan dalam rapat itu sendiri ke dalam basis pengetahuan perusahaan secara real-time. Sana asal Swedia, setelah mencapai valuasi 500 juta dolar AS (sekitar 775 miliar yen) melalui penggalangan dana 55 juta dolar AS (sekitar 8,5 miliar yen) yang dipimpin NEA pada Oktober 2024, diakuisisi oleh Workday pada 4 November 2025 dan diluncurkan kembali sebagai AI pengetahuan di dalam raksasa cloud SDM tersebut.

Skenario penggunaannya secara tipikal mencakup contoh-contoh: (1) organisasi yang dengan santai melupakan "bagaimana tim kami menangani kasus serupa di masa lalu" dalam layanan pelanggan, memvisualisasikan prosedur penyelesaian tasit melalui Interloom; (2) risiko "kebocoran besar-besaran pengetahuan" akibat pensiunnya para veteran di industri manufaktur atau keuangan, dilengkapi oleh graf pengetahuan Workhelix atau Synaply; (3) organisasi penjualan mengonversi "dengan prosedur apa sang top sales meraih kesepakatan besar" menjadi playbook yang dapat direplikasi melalui Glean/Otter. Perlu dicatat, Passive Capture selalu dibayangi oleh "resistensi psikologis karyawan terhadap pengawasan terus-menerus" dan "risiko pelanggaran regulasi perekaman". Penghentian segera penjualan umum Limitless yang diakuisisi Meta pun dibaca sebagai keputusan untuk menyerap biaya gesekan sosial ini sebagai perusahaan raksasa.

Agentic SOP — Dari buku panduan prosedur menuju agen eksekusi otonom

SOP Agentik adalah lapisan di mana deskripsi pekerjaan yang dihasilkan oleh ketiga lapisan di atas "tidak dibaca oleh manusia", melainkan "dibaca dan dijalankan langsung oleh agen AI". Sebagaimana ditunjukkan Sequoia Capital dalam esainya pada Januari 2026 berjudul "2026: This is AGI", mereka mendefinisikan pasar ini sebagai evolusi AI generatif dari "AI yang menggambarkan" menjadi "AI yang mencapai", dengan Long-Horizon Agent yang menuntaskan tugas berdurasi panjang sebagai aktor utamanya. Faktanya, yang mengumpulkan pendanaan paling besar pada 2026 justru adalah kelompok perusahaan agen yang menjalankan prosedur kerja secara otonom.

Sebagai contoh simbolis, dapat disebutkan Sierra yang dipimpin Bret Taylor. Sebagaimana dilaporkan secara bersamaan oleh TechCrunch dan CNBC pada 4 Mei 2026, Sierra menyelesaikan putaran pendanaan sebesar 950 juta dolar (sekitar 147 miliar yen) yang dipimpin bersama oleh Tiger Global dan GV milik Google, dengan valuasi pasca-pendanaan mencapai 15,8 miliar dolar (sekitar 2,4 triliun yen. Angka dari Tech Startups. Sebagian media membulatkannya menjadi "lebih dari 15 miliar dolar"). Ini sekitar lebih dari tiga kali lipat dibanding valuasi 4,5 miliar dolar (sekitar 700 miliar yen) satu setengah tahun sebelumnya. Sierra juga mengumumkan bersamaan bahwa total kumulatif pendanaannya telah melampaui 1 miliar dolar (sekitar 155 miliar yen). "Agen pengalaman pelanggan" AI telah melampaui ranah pemeriksaan pesanan dan reset kata sandi yang semula diperkirakan, dan kini mengemban tugas-tugas berat seperti penyusunan kredit perumahan (mortgage), klaim asuransi, manajemen langganan, hingga manajemen siklus pendapatan medis (revenue cycle management), dengan lebih dari 40% Fortune 50 sebagai pelanggannya. ARR-nya disebut telah mencapai 150 juta dolar (sekitar 23,3 miliar yen).

Yang sejajar dengan Sierra adalah Decagon dari San Francisco. Menurut TechCrunch, perusahaan tersebut menyelesaikan putaran Seri D sebesar 250 juta dolar (sekitar 38,8 miliar yen) yang dipimpin bersama oleh Coatue Management dan Index Ventures pada 28 Januari 2026, dengan valuasi 4,5 miliar dolar (sekitar 700 miliar yen). Total kumulatif pendanaan sejak berdiri lebih dari 231 juta dolar (sekitar 35,8 miliar yen), dan Andreessen Horowitz, Accel, dan lainnya juga terus memberikan dukungan. Kata kunci teknis Decagon adalah "Agent Operating Procedures (AOP)". Menurut penjelasan perusahaan, AOP adalah "SOP yang dapat dikompilasi" yang memungkinkan penulisan deskripsi aturan kerja dalam bahasa alami dan guardrail pada tingkat kode secara bersamaan; strukturnya memungkinkan non-engineer pun dapat segera mengubah logika kerja, sementara engineer dapat mencegah kesalahan melalui kerangka pengujian yang dapat diverifikasi. Di antara pelanggan Decagon berjajar SaaS B2C/B2B seperti Notion, Duolingo, Substack, Bilt, Rippling, dan ClassPass. Cara perusahaan tersebut mendeklarasikan bahwa "SOP kini bukan lagi dokumen yang dibaca manusia, melainkan berubah menjadi kumpulan logika yang ditafsirkan mesin" menunjukkan bahwa konsep SOP Agentik bukan sekadar kata-kata tren, melainkan filosofi desain inti dalam implementasi.

Cresta, yang memimpin dalam AI real-time untuk pusat panggilan (call center) perusahaan, menyelesaikan putaran Seri D sebesar 125 juta dolar (sekitar 19,4 miliar yen) yang dipimpin oleh World Innovation Lab (WiL) dan Qatar Investment Authority pada November 2024, dan telah mengumpulkan total kumulatif lebih dari 270 juta dolar (sekitar 41,9 miliar yen). Dengan AI percakapan real-time, ia membisikkan saran ke telinga operator manusia, dan mengambil bentuk hibrida yang juga dapat beralih ke respons otomatis penuh. Di ranah kepatuhan (compliance), Norm Ai dari New York merupakan keberadaan yang khas. Pada Maret 2025 mengumumkan Seri B sebesar 48 juta dolar (sekitar 7,4 miliar yen) (kumulatif 147 juta dolar = sekitar 22,8 miliar yen), dan pada 19 Februari 2026 diumumkan bahwa agen dasar perusahaan tersebut akan diintegrasikan ke Microsoft Foundry, dengan Coatue dan Blackstone berjajar sebagai pendukung. Konsep Norm Ai yang mengubah teks regulasi hukum menjadi "agen AI yang dapat menjalankan SOP kepatuhan" merupakan contoh tipikal di dalam SOP Agentik, khususnya untuk industri yang teregulasi.

Yang membesar dengan label "insinyur perangkat lunak otonom" adalah Cognition AI; sebagaimana dilaporkan Bloomberg dan SiliconANGLE pada 23 April 2026, dikabarkan bahwa perusahaan tersebut sedang membahas penggalangan putaran pendanaan dalam satuan ratusan juta dolar dengan valuasi 25 miliar dolar (sekitar 3,9 triliun yen). Karena pada putaran sebelumnya pada September 2025 valuasinya adalah 10,2 miliar dolar (sekitar 1,6 triliun yen), maka secara hitungan valuasinya membengkak 2,5 kali lipat dalam waktu sedikit lebih dari setengah tahun. Devin milik perusahaan tersebut diumumkan telah menghasilkan ARR berskala 73 juta dolar (sekitar 11,3 miliar yen) di Goldman Sachs, Citi, Dell, Cisco, Ramp, Palantir, Nubank, Mercado Libre, dan lainnya (per sebelum akuisisi Windsurf), dan telah memasuki tahap pembuktian sebagai agen yang menjalankan "tugas-tugas bersifat SOP" para insinyur secara otonom.

Dan, memperebutkan peran "menopang sebagai OS" kelompok agen vertikal semacam itu, OpenAI dan Anthropic membuka garis pertempuran baru. OpenAI meluncurkan produk peramban (browser) tunggal bernama "ChatGPT Atlas" pada 21 Oktober 2025, dan menyediakan mode agen untuk Plus, Pro, dan Business. Atlas dirancang dengan gagasan "ChatGPT duduk di atas bilah URL, bukan di balik bilah URL", dan dibangun agar agen menyelesaikan pekerjaan dengan mempertimbangkan konteks layar dan keadaan tab. Anthropic, pada 23 Maret 2026, membuka "Claude Cowork"—produk dari fitur "penggunaan komputer" yang sebelumnya merupakan pratinjau riset—untuk langganan berbayar, dan menurut artikel CNBC tertanggal 24 Maret 2026, pada 9 April produk tersebut tersedia secara umum (GA) dengan dukungan Mac/Windows. Versi enterprise dilengkapi dengan kontrol akses berbasis peran, batas pengeluaran grup, konektor Zoom MCP, dan lainnya. Dengan Mistral asal Prancis, OpenAI asal AS, dan Anthropic asal AS yang bersama-sama ikut serta dalam persaingan akurasi "agen penggunaan komputer", kemungkinan "lapisan eksekusi" SOP Agentik akan terkomoditisasi sekaligus semakin meningkat.

Sebagai skenario penggunaan: (1) tim customer success SaaS mempercayakan "tindak lanjut otomatis terhadap pelanggan yang dikhawatirkan akan membatalkan kontrak" kepada agen Sierra atau Decagon untuk meningkatkan tingkat pencegahan pembatalan, (2) bank besar menjalankan seluruh prosedur KYC secara otomatis melalui agen regulasi Norm Ai sehingga meminimalkan tinjauan tenaga manusia, (3) departemen TI manufaktur global menjawab pertanyaan layanan lapangan (field service) secara otomatis melalui Cresta—demikianlah, semakin jelas alir di mana pekerjaan yang selama ini "dilakukan manusia sambil mengoperasikan layar dengan satu tangan memegang SOP" kini tuntas di dalam agen.


Bagaimana VC Utama Silicon Valley Memahaminya — Pergeseran Tektonik dari "Perangkat Lunak ke Layanan"

Ketika empat lapisan dari Screen-to-SOP hingga Agentic SOP dipahami sebagai satu paket, tesis makro yang sama-sama dibahas oleh para VC papan atas Silicon Valley adalah bahwa pusat pasar AI bergeser dari "perangkat lunak itu sendiri" ke "pekerjaan yang dicapai oleh perangkat lunak". Pada AI Ascent 2026 yang diselenggarakan oleh Sequoia Capital di San Francisco pada 20 April 2026, Pat Grady, Sonya Huang, dan Konstantine Buhler mengusung panji "2026 is AGI". Mereka menegaskan bahwa "kemajuan setara 100 tahun akan dijalankan dalam 100 hari", dan memperkirakan ukuran pasar yang dapat dikerjakan oleh layanan AI sebesar 10 triliun dolar (sekitar 1.550 triliun yen). Angka ini sekitar belasan kali lipat dari "pasar perangkat lunak sekitar 600 miliar dolar" yang konvensional. Makna dari Sequoia menempatkan agen sebagai "tenaga kerja yang langsung menggantikan layanan manusia" sebagai tema jangka panjang sangatlah besar, dan fakta bahwa mereka berinvestasi 75 juta dolar (sekitar 11,6 miliar yen) di seri C RogoAI (agen finansial) serta terus berinvestasi pada putaran pendanaan besar Sierra, secara gamblang menunjukkan daya eksekusi mereka.

Andreessen Horowitz (a16z) dalam seri Big Ideas 2026 di awal tahun 2026 menempatkan "Enterprise Orchestration Layer" dan "Agentic Interface" sebagai tema terpenting tahun itu. Serangkaian memo mereka lebih konkret, menganalisis bahwa "AI akan menjauh dari UI obrolan dan menjadi entitas yang bertindak secara aktif", "antarmuka akan didesain ulang dari yang ditujukan untuk manusia menjadi untuk agen", dan "lalu lintas pekerjaan akan bergeser dari kecepatan manusia ke 'kecepatan agen', di mana ribuan panggilan API simultan bercabang dari satu tujuan tunggal". Langkah a16z yang menanamkan modal Series C ke Decagon, berpartisipasi di Sierra sejak awal, dan terus mendukung Cresta, merupakan contoh khas dari strategi investasi yang berupaya menguasai tumpukan Agentic SOP secara vertikal. Dalam "State of AI: An Empirical 100 Trillion Token Study" yang dipublikasikan a16z pada April 2026, ditunjukkan bahwa bentuk konsumsi lalu lintas API melalui OpenRouter yang tumbuh paling pesat adalah "penalaran agentik" (beban kerja yang berjalan terus-menerus dalam waktu lama dari satu instruksi), dan hal ini juga memperkuat kebutuhan komputasi riil dari Agentic SOP.

Bessemer Venture Partners berdasarkan pengalaman 10 tahun menjalankan Cloud 100, mengumumkan bahwa "rata-rata waktu yang dibutuhkan startup AI untuk mencapai $100M ARR telah memendek dari 7,5 tahun pada perusahaan cloud konvensional menjadi 5,7 tahun". Total nilai valuasi seluruh Cloud 100 menembus 1 triliun dolar (sekitar 155 triliun yen) untuk pertama kalinya per Agustus 2025. Bessemer mengangkat "Securing AI Agents (keamanan agen AI)" sebagai agenda prioritas tahun 2026, dan menekankan sudut pandang bahwa penyebaran Agentic SOP sekaligus akan melahirkan pasar keamanan dan tata kelola yang sangat besar dan belum tergarap.

Lightspeed Venture Partners pada Desember 2025 mengumumkan dana baru dengan total lebih dari 9 miliar dolar (sekitar 1,4 triliun yen), dan secara eksplisit menyatakan niat untuk menanamkan sebagian besarnya ke ranah agen AI. Mereka berpartisipasi dalam seri B senilai 45 juta dolar (sekitar 7 miliar yen) di Zocks, asisten AI untuk Financial Advisor, dan mengambil strategi menggarap Agentic SOP sebagai "agen tipe spesialisasi industri (vertikal)".

Dana lintas (crossover) seperti Tiger Global, Coatue, Index Ventures, dan Insight Partners juga mencolok dalam menanamkan modal baik ke pemain lama Screen-to-SOP (Tango, Scribe, Bardeen) maupun ke pemain baru Agentic SOP (Sierra, Decagon). Ini menjadi bukti bahwa mereka melihat angin pendukung struktural di mana baik "volume SOP yang dihasilkan di lapangan" maupun "volume SOP yang dikonsumsi oleh agen" sama-sama berkembang secara bersamaan.

Tema yang sering disebut sebagai sumber perbedaan pandangan di antara para VC adalah kekhawatiran privasi yang menyertai Passive Capture serta risiko hubungan kerja. Dalam komentar Sequoia maupun podcast a16z, di satu sisi mereka menggambarkan secara positif "masyarakat di mana perekaman terus-menerus menjadi hal lumrah", namun di sisi lain berulang kali terlihat nada yang menasihati pihak perusahaan bahwa "Capture Layer sebaiknya dilekatkan pada alur kerja yang sudah ada, dan tidak boleh memaksakan alur kerja baru yang terpisah kepada karyawan". Faktanya, kisah Limitless yang menghentikan perangkat keras untuk konsumen dan diserap ke Meta berulang kali dikutip di kalangan VC sebagai peringatan bahwa startup independen tidak mampu sepenuhnya menyerap friksi sosial.

Nada pemberitaan media utama dan fluktuasi angka

Nada pemberitaan media-media utama juga terbagi jelas pada masing-masing dari empat lapisan tersebut. Screen-to-SOP dan Video-to-SOP diperlakukan dengan deskripsi yang tenang oleh TechCrunch, VentureBeat, kolom teknologi CTech, serta rubrik enterprise Bloomberg, sebagai "bidang yang sederhana tetapi bermargin tinggi yang telah memasuki fase praktis." Misalnya, artikel terkait Scribe yang diterbitkan TechCrunch tertanggal 10 November 2025 menilai bahwa "Scribe akhirnya mulai menunjukkan tempat di mana AI menghasilkan uang di lapangan," dan membahas kewajaran valuasi sebesar US$1,3 miliar (sekitar ¥201,5 miliar) dalam konteks rasio terhadap pendapatan. Pemberitaan Calcalist tentang Guidde menonjolkan poin bahwa startup asal Israel ini telah tumbuh ke skala US$50 juta (sekitar ¥7,7 miliar) dengan frasa kunci "menjembatani kesenjangan antara AI dan karyawan," sehingga pembingkaian berbasis konteks regional terasa efektif.

Sebaliknya, Agentic SOP cenderung diberitakan oleh CNBC, Bloomberg, WSJ, dan TechCrunch dengan ungkapan nilai yang mencolok, sebagai "garis depan ledakan AI San Francisco." Penggalangan dana Sierra senilai US$950 juta digambarkan dalam bingkai perebutan hegemoni AI enterprise, sebagaimana ditulis CNBC dengan "Bret Taylor's Sierra raises nearly $1B," TechCrunch dengan "the race to own enterprise AI gets serious," dan Bloomberg dengan "triple valuation in 18 months." Mengenai valuasi akhir Sierra, TechCrunch mencantumkan US$15 miliar (US$15B), Tech Startups mencantumkan US$15,8 miliar (US$15,8B), dan CMSWire mencantumkan US$15 miliar, sehingga terdapat sedikit fluktuasi antarmedia (kemungkinan US$15,8 miliar adalah angka post-money dan US$15 miliar adalah angka pembulatan). Valuasi Cognition sebesar US$25 miliar masih dalam tahap "talks," dan perlu dipahami sebagai elemen yang belum pasti, termasuk catatan Bloomberg yang menyebutkan "masih dalam pembahasan dan persyaratannya mungkin berubah."

Di media berbahasa Jepang, Nikkei dan Toyo Keizai memuatnya dalam artikel ringkasan dengan judul seperti "AI bisnis AS, berevolusi menuju pembuatan SOP otomatis," tetapi artikel yang mengupas konteks mendalam—seperti jejaring Stanford yang dimiliki Workhelix, konteks kepatuhan regulasi Eropa Interloom, atau tesis "Services-as-a-Software" dari Sequoia—masih sedikit. Forbes Japan secara berkelanjutan menerbitkan artikel terjemahan tentang Cloud 100 dan Sequoia AI Ascent, sehingga menyediakan cakupan yang relatif mendalam.

Terlepas dari nada pemberitaan, angka ukuran pasar pun memiliki fluktuasi besar antarmedia maupun antarlembaga riset. Fortune Business Insights memperkirakan pasar agen akan mencapai skala dari US$914 juta menjadi US$13,919 miliar (sekitar ¥2,16 triliun) pada 2026, dan melampaui sekitar ¥2 triliun pada 2034, menunjukkan CAGR sebesar 40,5% per tahun. Sementara itu, perkiraan lain seperti dari Joget menghitung ukuran pasar 2026 sebesar US$1,09–1,206 miliar, dengan pertumbuhan pesat hingga sekitar US$93 miliar (sekitar ¥14,4 triliun) pada 2030, yakni 44–46% per tahun. Sebagai prakiraan Baseline, Gartner memperkirakan bahwa "40% aplikasi enterprise akan menyematkan agen AI khusus tugas pada akhir 2026, melonjak dari kurang dari 5% pada 2025," dan dalam skenario terbaik memandang pasar ini bisa berkembang menjadi skala US$1,45 triliun (sekitar ¥225 triliun) pada 2035. McKinsey secara terpisah mengeluarkan angka bahwa 44% pekerjaan di AS dapat dijalankan dengan kemampuan agen AI saat ini, dan akan menciptakan nilai ekonomi sebesar US$2,9 triliun (sekitar ¥450 triliun) di AS pada 2030; meskipun skala besarannya berbeda jauh dalam orde antarmedia, semuanya sepakat pada arah yang sama, yaitu "raksasa."

Struktur pemenang dan pecundang dilihat dari sudut pandang investor

Jika kita memandang secara menyeluruh portofolio investasi para VC Silicon Valley, akan terlihat struktur antara kategori pemenang dan kategori yang mulai tertinggal. Pemenang terbesar adalah para pemain "tipe layanan tuntas" dari Agentic SOP, di mana Sierra, Decagon, Cognition, Cresta, dan Norm Ai—per Mei 2026—menaiki tangga valuasi satu anak tangga demi satu anak tangga. Kekuatan mereka terletak pada kemampuan menjalin kontrak komitmen dengan perusahaan klien untuk "menuntaskan" pekerjaan hingga akhir, bukan sekadar memuntahkan SOP sebagai dokumen; hasilnya, mereka mampu memotong anggaran biaya tenaga kerja (yang diperkirakan Sequoia sekitar 6 kali lipat anggaran perangkat lunak).

Pemenang berikutnya adalah perusahaan process intelligence yang melintasi ranah Screen-to-SOP dan Passive Capture. Celonis ditempatkan sebagai pemimpin di area Process Intelligence pada Gartner Magic Quadrant Februari 2026, dan menyatakan keikutsertaannya dalam infrastruktur Agentic SOP melalui kombinasi AgentC suite dan Process Copilots. Glean melambungkan valuasinya sebagai "lapisan terpadu di balik aplikasi" yang mengimplementasikan koordinasi agen di atas fondasi pencarian real-time bergaya ClickHouse.

Yang menarik perhatian sebagai penantang adalah Interloom yang berasal dari Eropa, serta startup Passive Capture seperti Workhelix dan Synaply yang bertarung dengan mengenakan kulit luar yang berorientasi konsumen. Mereka mengusung strategi menjual "knowledge graph khas tiap perusahaan" alih-alih "standar SOP yang seragam di seluruh industri", sehingga menjawab langsung sanggahan klasik perusahaan enterprise bahwa "perusahaan kami itu spesial". Berita pada Q1 2026 bahwa sebuah perusahaan besar AS mengadopsi Interloom (Yahoo Finance, TheNextWeb) dibaca sebagai pertanda bahwa pendekatan bertipe context graph semacam ini mulai diterima pula oleh para pemain besar AS.

Sebaliknya, ada pula area yang relatif diperkirakan akan kesulitan. Pertama, lapisan DAP konvensional seperti Whatfix yang "sekadar menampilkan panduan di layar" kemungkinan besar akan segera ditelan oleh "agen pengguna komputer" seperti Scribe, Guidde, hingga Anthropic Cowork. WalkMe yang kini berada di bawah SAP pun telah memudar daya tariknya sebagai kandidat akuisisi yang independen. Kedua, "perangkat keras konsumen tipe perekaman terus-menerus" yang dilambangkan oleh Limitless kini menampilkan risiko yang jelas bahwa regulasi dan friksi sosial melampaui kemajuan teknologi, sehingga startup independen dinilai sulit bertahan hidup sendirian. Ketiga, manajemen pengetahuan tipe SaaS gaya lama yang terus menyimpan SOP dalam bentuk PDF atau HTML sederhana tampaknya akan semakin sering tersisih dalam RFP (request for proposal) perusahaan jika tidak mampu beralih ke format yang dapat dibaca mesin dan dioptimalkan untuk pembacaan AI.

Dan, perubahan struktural yang paling menarik adalah posisi para "veteran BPM (business process management) di ranah layanan perangkat lunak". Para pemenang era RPA seperti UiPath, Automation Anywhere, dan Blue Prism (di bawah SS&C) tampaknya akan terdorong menjadi "sekadar sistem eksekusi" di dunia Agentic SOP, sehingga masing-masing perusahaan tengah melakukan renovasi besar menuju desain yang LLM-native. UiPath sejak awal 2026 mendorong kerangka operasional yang disebut "AgentOps", sementara Automation Anywhere menonjolkan "Autonomous Enterprise" secara penuh hingga menjadi materi studi kasus di Stanford Graduate School of Business. Perdebatan seputar matinya RPA telah berlangsung sejak 2025, tetapi pada paruh pertama 2026 terasa bahwa pertarungan ini hampir sepenuhnya terputuskan.

Pergerakan yang diperkirakan terjadi pada paruh kedua tahun 2026 dan setelahnya, serta kapan dan apa yang harus diamati

Tonggak-tonggak konkret yang perlu diamati selama kurang lebih 12 bulan sejak Mei 2026 dapat dikelompokkan ke dalam beberapa poros.

Pertama, kemungkinan besar persiapan pencatatan saham (IPO) dari "lapisan eksekusi" Agentic SOP akan terus berkembang. Sierra, pada Mei 2026, memiliki ARR tahunan sebesar 150 juta dolar AS, valuasi 15,8 miliar dolar AS, dengan rasio ARR sekitar 100 kali yang tergolong sangat tinggi; namun, jika pada periode yang sama tahun depan ARR-nya melampaui 500 juta dolar AS, maka IPO pada kuartal kedua hingga kuartal ketiga 2027 menjadi pilihan yang realistis. Demikian pula Decagon, jika dapat memproyeksikan ARR melebihi 100 juta dolar AS pada kuartal keempat 2026, maka peristiwa likuiditas yang berpusat pada Seri E atau secondary dalam tahun 2027 mulai terlihat. Cresta, Glean, dan Cognition juga secara berkesinambungan disebut namanya sebagai kandidat IPO di berbagai media.

Kedua, apakah penyebaran enterprise yang sesungguhnya dari Anthropic Cowork dan pertumbuhan OpenAI ChatGPT Atlas akan menekan eksistensi perusahaan Agentic SOP independen, akan menjadi fokus utama paruh kedua 2026. Pemain dengan lapisan yang tebal—seperti AOP milik Decagon yang "menempatkan guardrail kelas enterprise serta pengetahuan operasional di atas model Foundation"—akan mampu bertahan, tetapi pemain menengah yang memberikan nilai melalui wrapper tipis berkemungkinan besar akan tersingkir. Bessemer memprediksi bahwa "antara Q4 2026 hingga Q2 2027, akan terjadi akuisisi terkonsentrasi di bidang keamanan dan tata kelola agen."

Ketiga, lingkungan regulasi Passive Capture akan semakin ketat akibat kombinasi EU AI Act dan EU GDPR, dan ada kemungkinan perusahaan berbasis di Eropa seperti Interloom mulai merambah ke perusahaan-perusahaan besar AS sebagai juara "Passive Capture yang ramah regulasi". Sebaliknya, pendekatan seperti yang dijalankan Workhelix berupa "dekomposisi tingkat tugas dan peta jalan penerapan" cenderung semakin didukung oleh CIO dan CHRO dari sudut pandang tata kelola perusahaan, dan aliran integrasinya ke dalam perangkat standar perusahaan konsultan seperti Accenture, Deloitte, dan KPMG juga mulai terlihat. Pernyataan Guidde dalam penggalangan dana kali ini yang secara tegas menyebut kemitraan implementasi dengan KPMG dan Deloitte dapat dianggap sebagai contoh perintis dari hal tersebut.

Keempat, bagaimana ekspansi di pasar Jepang akan bergerak juga merupakan poin pengamatan. Sierra dan Decagon, pada Mei 2026, belum secara resmi mengumumkan pendirian entitas hukum di Jepang, tetapi dari fakta bahwa World Innovation Lab (WiL) melakukan investasi besar pada Cresta, serta fakta bahwa Qualcomm Ventures berinvestasi pada Guidde, jaringan reseller ke perusahaan-perusahaan besar Jepang secara bertahap mulai tertata. Sebagai tantangan khas Jepang, SOP (prosedur operasional) berbasis kertas sangat tebal dan kerap kali mencakup proses "stempel dan pembubuhan cap (hanko)", sehingga ada kekhawatiran bahwa Screen-to-SOP atau Passive Capture jika diimpor begitu saja akan memiliki tingkat kecocokan yang rendah. Justru, ada kemungkinan ceruk berupa konversi SOP kertas ke format AOP (Agent Operating Procedure) melalui OCR akan bangkit di pasar Jepang. Kesaksian dari kalangan industri bahwa NRI, Fujitsu, dan NEC sudah menjalankan R&D internal ke arah ini terdengar di sejumlah konferensi industri, dan apakah pemain orisinal asal perusahaan Jepang akan muncul pada paruh kedua 2026 menjadi hal yang menarik.

Kelima, adalah perkembangan ukuran pasar itu sendiri. Menurut beberapa riset, pasar Agentic AI diperkirakan dimulai dari sekitar 10 miliar dolar AS (sekitar 1,5 triliun yen) pada 2026, dan akan berkembang hingga skala 90 hingga 140 miliar dolar AS (sekitar 14 hingga 22 triliun yen) menjelang awal dekade 2030-an. Terhadap hal ini, perkiraan Sequoia mengenai "Services-as-a-Software" (10 triliun dolar AS = sekitar 1.550 triliun yen) terlalu besar; namun angka ini diambil sebagai batas atas dari "keseluruhan belanja tenaga kerja yang akan direbut", dan yang sebenarnya dapat ditagihkan oleh perusahaan agen hanyalah sebagian darinya. Meski demikian, hampir dapat dipastikan bahwa skalanya beberapa kali lipat dari pasar perangkat lunak.

Pada akhirnya, keempat lapisan—Screen-to-SOP, Video-to-SOP, Passive Capture, dan Agentic SOP—bergerak ke arah integrasi, bukan sebagai pasar yang terpisah, melainkan sebagai satu jalur pipa tunggal yang "mengonversi pengetahuan tersirat dalam kepala para ahli ke format yang dapat dibaca mesin, lalu dieksekusi oleh agen". VC Silicon Valley berinvestasi besar pada setiap lapisan jalur pipa ini, dan di sisi enterprise pun, kebutuhan seperti "ingin meminimalkan kebocoran pengetahuan akibat pensiunnya para veteran", "ingin menutupi kekurangan tenaga kerja", dan "ingin memangkas jam kerja kepatuhan" saling berpadu, sehingga integrasi stack berlangsung dengan cepat. Paruh kedua 2026 tampaknya akan menjadi 12 bulan yang menentukan di mana perusahaan-perusahaan perwakilan dari masing-masing lapisan melangkah ke tahap berikutnya (IPO, akuisisi, peluncuran layanan baru).


Sumber