Apa itu RSI (Recursive Self-Improvement) — Mulai dari Gambaran Besarnya

RSI (Recursive Self-Improvement / Peningkatan Diri Secara Rekursif) adalah, secara sederhana, proses di mana "AI meningkatkan kemampuannya sendiri hampir tanpa campur tangan manusia, lalu menggunakan kemampuan yang telah ditingkatkan itu untuk meningkatkan dirinya lebih jauh lagi." AI yang menjadi sedikit lebih cerdas kemudian menciptakan AI yang lebih cerdas lagi. AI itu pun menciptakan AI yang bahkan lebih cerdas. Ketika loop bersarang (rekursif) ini mulai berputar, kecepatan peningkatan itu sendiri akan berakselerasi, sehingga dalam waktu singkat bisa mencapai titik yang jauh melampaui kecerdasan manusia — konsep ini pertama kali diformulasikan pada tahun 1965 oleh matematikawan I.J. Good sebagai "ledakan kecerdasan (intelligence explosion)", dan selama lebih dari setengah abad hanya bertahan sebagai eksperimen pikiran.

Namun antara tahun 2025 dan 2026, konsep ini tiba-tiba turun dari ranah filsafat spekulatif ke penelitian teknologi nyata. Yang paling simbolis adalah konferensi internasional utama bidang pembelajaran mesin, ICLR, yang pada April 2026 mengadakan workshop internasional pertama yang berfokus pada RSI di Rio de Janeiro. Fakta bahwa para peneliti mulai serius mendiskusikan prinsip-prinsip umum dan metode evaluasi untuk "sistem AI yang dapat meningkatkan diri sendiri" itu sendiri mencerminkan perubahan zaman.

Agar tidak berhenti pada tataran abstrak, mari kita lihat contoh konkretnya. Menurut data yang dipublikasikan oleh Anthropic, pada akhir tahun 2025 kode yang ditulis Claude masih sedikit lebih rendah kualitasnya dibandingkan kode yang ditulis oleh para insinyur perusahaan tersebut, namun pada pertengahan tahun 2026 saat ini, kualitasnya telah mencapai tingkat yang hampir setara. Lebih dari 80% kode yang di-merge ke basis kode perusahaan sudah ditulis oleh Claude, dan pada kuartal kedua tahun 2026, jumlah kode yang di-merge oleh satu insinyur biasa dalam sehari meningkat sekitar 8 kali lipat dibandingkan tahun 2024. Karena AI memproduksi kode begitu cepat dan dalam jumlah besar, bahkan dilaporkan bahwa "review kode oleh manusia kini menjadi hambatan baru." Dengan kata lain, RSI bukanlah fiksi ilmiah di masa depan yang jauh, melainkan kenyataan yang sudah sebagian berjalan di dalam perusahaan-perusahaan AI saat ini.

Pria yang Mendemonstrasikan "Riset Mandiri" — Sosok Bernama Andrej Karpathy

Yang berdiri di garis terdepan RSI ini adalah Andrej Karpathy. Rekam jejaknya merupakan cerminan langsung dari era deep learning. Ia memulai karier sebagai salah satu anggota pendiri OpenAI, pindah ke Tesla pada 2017 untuk memimpin divisi AI kendaraan otonom (Full Self-Driving dan Autopilot), meninggalkan Tesla pada 2022, sempat kembali ke OpenAI pada 2023, lalu pada 2024 berdiri sendiri dan mendirikan startup pendidikan AI bernama Eureka Labs. Ia dijuluki "pendidik terbaik di dunia" karena melalui kursus online dan penjelasan YouTube-nya, ia mampu menguraikan cara kerja jaringan saraf yang rumit dengan lebih gamblang dari siapa pun, sehingga telah mengajarkan dasar-dasar LLM kepada para insinyur di seluruh dunia. Ia adalah sosok langka yang sekaligus berada di puncak sebagai peneliti maupun pendidik.

Eksperimen yang Karpathy pamerkan di media sosialnya pada Maret 2026 itulah yang membuat RSI menjadi sesuatu yang dapat dipahami oleh orang awam. Ia memberikan agen pengkodean AI dan sebuah model bahasa kecil pada proyek pembelajaran mini buatannya sendiri bernama "nanochat", lalu membiarkannya berjalan hampir tanpa pengawasan selama dua hari. Agen tersebut berulang kali mengutak-atik lalu mencoba kode pelatihan (resep pelatihan) secara mandiri, melakukan sekitar 700 perubahan otonom. Hasilnya, ia mengumpulkan sekitar 20 "peningkatan yang ditemukan sendiri", termasuk penyesuaian koefisien normalisasi, penyesuaian parameter mekanisme perhatian, dan perubahan konfigurasi algoritma optimasi, sehingga berhasil memangkas waktu pelatihan dari 2,02 jam menjadi 1,80 jam — sekitar 11%. Lebih dari itu, sebagian besar peningkatan tersebut dapat langsung diterapkan dari model kecil (kedalaman 12 lapisan) ke model yang lebih besar (kedalaman 24 lapisan).

Pra-pelatihan (pre-training) adalah proses yang paling besar investasinya bagi perusahaan AI, dan peningkatan efisiensi sekecil apa pun akan berkembang secara eksponensial seiring bertambahnya skala. Karpathy sendiri menggambarkan eksperimen ini sebagai "part code, part sci-fi, and a pinch of psychosis" (sebagian kode, sebagian fiksi ilmiah, dan sedikit kegilaan), dan menyebutnya sebagai "final boss battle" (pertarungan bos terakhir) bagi laboratorium riset AI terdepan. AI yang mengoptimalkan cara pembuatan dirinya sendiri — miniatur RSI itu telah didemonstrasikan oleh pendidik terbaik dunia dalam sebuah eksperimen di rumahnya sendiri.

Kepindahan Mengejutkan — Karpathy Bergabung dengan Tim "Pre-training" Anthropic

Sekitar dua bulan setelah eksperimen tersebut, tepatnya pada 19 Mei 2026, Karpathy mengumumkan di media sosial: "Laporan pribadi: Saya bergabung dengan Anthropic," sebuah pengumuman yang mengguncang industri. Dalam kata-katanya sendiri, "Saya pikir beberapa tahun ke depan akan menjadi periode yang sangat menentukan bagi frontier LLM. Saya sangat antusias bisa bergabung dengan tim di sini dan kembali ke penelitian dan pengembangan (R&D)." Ia juga menambahkan, "Semangat saya untuk pendidikan tidak berubah, dan saya bermaksud untuk melanjutkan pekerjaan itu suatu saat nanti."

Menurut laporan TechCrunch dan CNBC, Karpathy bergabung dengan tim pra-pelatihan Anthropic yang dipimpin oleh Nick Joseph, dengan fokus untuk "membangun tim yang berfokus pada percepatan penelitian pra-pelatihan menggunakan Claude." Tim pra-pelatihan adalah divisi yang bertanggung jawab atas proses pelatihan skala besar yang memberikan pengetahuan dan kemampuan inti kepada Claude. Singkatnya, misinya adalah menjalankan "autoresearch (penelitian mandiri)" yang ia demonstrasikan di rumahnya pada bulan Maret dalam skala industri menggunakan model frontier berkelas dunia — membuat Claude memperbaiki cara pembuatan Claude berikutnya, yaitu RSI itu sendiri. Syarat kompensasi dan ekuitas dari Anthropic tidak diungkapkan.

Simbolisme perpindahan ini memiliki bobot ganda. Pertama, ini adalah peristiwa besar dalam perang talenta: salah satu anggota pendiri OpenAI berpindah ke rival terbesarnya, Anthropic, bahkan ke tim pra-pelatihan yang membangun inti model. Kedua, Karpathy sendiri sebenarnya termasuk kubu yang berhati-hati, berpendapat bahwa "AGI masih 10 tahun lagi." Dalam podcast Dwarkesh Patel pada Oktober 2025, ia menyatakan bahwa saat ini bukan "tahun agen" melainkan "dekade agen," menyebut kode yang dihasilkan model saat ini secara blak-blakan sebagai "slop (produk berkualitas rendah)," dan mengungkapkan intuisi kuatnya bahwa "tren jangka panjang pertumbuhan ekonomi sekitar 2% per tahun tidak akan goyah" meski ada AI. Ini adalah penyeimbang yang membumi terhadap narasi AGI masa depan yang terlalu panas. Dan secara ironis, si hati-hati inilah yang kini memegang engkol mesin RSI yang paling akseleratif.

Apa itu Mythos――"Model Frontier Terkuat" yang Tidak Dipublikasikan

"Mythos" yang disebutkan dalam judul artikel adalah model frontier yang tidak tersedia untuk publik, yang disebut Anthropic sebagai "Claude Mythos Preview." Model ini merupakan model serba guna yang diklaim telah mencapai tingkat kemampuan melampaui manusia — kecuali segelintir manusia terbaik di bidangnya — terutama dalam hal menemukan dan mengeksploitasi kerentanan perangkat lunak. Mythos dilaporkan telah menemukan ribuan kerentanan kritis, dan diklaim telah menemukan celah yang belum diketahui pada hampir semua sistem operasi utama dan browser web utama.

Karena kemampuannya yang sangat tinggi, dan mengingat domain siber memiliki dua sisi — "pertahanan" dan "serangan" — Anthropic tidak menyediakan model ini untuk publik umum, melainkan hanya memberikan akses kepada lembaga pemerintah tertentu dan operator infrastruktur kritis melalui kerangka kerja bernama "Project Glasswing." Menurut pengumuman resmi perusahaan, Glasswing awalnya dimulai dengan sekitar 50 mitra awal, dan hanya dalam beberapa minggu setelah beroperasi, para mitra tersebut berhasil menemukan lebih dari 10.000 kerentanan dengan tingkat keparahan "tinggi" atau "kritis." Kemudian pada 2 Juni 2026, Anthropic mengumumkan perluasan akses ke sekitar 150 organisasi di lebih dari 15 negara — banyak di antaranya adalah pengelola infrastruktur kritis yang "satu serangan besar saja bisa berdampak pada lebih dari 100 juta orang." Lebih lanjut, menurut Bloomberg, lembaga keamanan siber Uni Eropa, ENISA, diperkirakan akan menjadi lembaga EU pertama yang mendapatkan akses ke Mythos. Anthropic menetapkan tujuan akhirnya sebagai "memungkinkan model berkelas Mythos, dilengkapi dengan pengamanan kuat yang dapat mendeteksi dan memblokir output paling berbahaya, untuk akhirnya dapat digunakan secara luas demi pertahanan siber."

Di sini, ada satu hal yang perlu diperjelas secara akurat — sesuatu yang sering dikaburkan oleh situs-situs lain. Yang ditegaskan secara eksplisit oleh informasi publik adalah dua hal: (1) Mythos saat ini adalah model frontier "tidak dipublikasikan" Anthropic yang paling kuat; dan (2) tim Karpathy menggunakan "Claude (khususnya Claude Opus di garis terdepan)" untuk mempercepat pra-pelatihan. Misalnya, dalam loop autoresearch ala Karpathy, dilaporkan bahwa Claude Opus 4.6 dijalankan secara terus-menerus selama lebih dari 12 jam melewati 118 eksperimen. Namun demikian, Anthropic tidak secara resmi menyatakan bahwa "varian spesifik bernama Mythos" digunakan secara konkret di dalam loop riset mandiri tersebut. Oleh karena itu, gambaran "Mythos × RSI" yang diikat oleh judul artikel ini paling tepat dibaca sebagai simbol dari gambaran besar bahwa Anthropic telah mulai mengarahkan "kemampuan terkuatnya" ke dalam (pengembangan dirinya sendiri). Kemampuan serangan terkuat (penemuan kerentanan) dan kemampuan peningkatan diri terkuat (optimalisasi pra-pelatihan) lahir dari silsilah frontier yang sama dalam satu perusahaan yang sama — inilah fakta yang menjadi inti persoalannya.

"Seruan Perlambatan" Anthropic――Mengerem Mesin yang Mereka Rakit Sendiri

Pada awal Juni 2026 (berbagai media melaporkan tanggal 4–5 Juni), Anthropic melalui lembaga risetnya "Anthropic Institute" mempublikasikan esai berjudul "When AI builds itself (Ketika AI membangun dirinya sendiri)." Penulisnya adalah Marina Favaro (kepala lembaga riset tersebut) dan salah satu pendiri perusahaan, Jack Clark. Isinya mendorong perusahaan-perusahaan AI terkemuka di dunia untuk mempertimbangkan secara serius "perlambatan koordinatif, atau jeda sementara" dalam pengembangan AI frontier.

Esai ini mendefinisikan RSI sebagai "sistem AI yang mampu merancang dan mengembangkan penerusnya sendiri secara sepenuhnya otonom." Perusahaan menyatakan bahwa hal ini "bukanlah sesuatu yang tak terhindarkan," namun memperingatkan bahwa itu "bisa datang lebih cepat dari yang dipersiapkan oleh banyak organisasi." Inti dari rekomendasi ini terletak pada "verifiabilitas (verifiability)" — yang mengakui ketidakrealistisan berhenti sendirian. Anthropic menulis: "Jika sistem semacam itu ada, kami memperkirakan akan memperlambat atau menjeda langkah kami jika pengembang lain yang berada di frontier atau mendekatinya juga melakukan hal yang sama secara terverifikasi." Ini adalah proposal bersyarat — "jika semua pihak benar-benar dapat saling mengkonfirmasi bahwa mereka berhenti, maka kami pun akan berhenti" — dengan kewaspadaan kuat terhadap pelanggaran diam-diam sebagai premisnya.

Kesulitan ini diungkapkan perusahaan dengan sangat lugas: "Training run jauh lebih mudah disembunyikan daripada silo rudal, inputnya bersifat serbaguna, dan insentif untuk bergerak diam-diam sangatlah besar — karena siapa yang terus berlari sementara yang lain berhenti akan mewarisi kepemimpinan." Sambil mengutip rezim perlucutan senjata seperti Perjanjian INF sebagai referensi historis, esai ini menutup dengan pernyataan: "Rezim semacam itu membutuhkan puluhan tahun untuk membangun mekanisme kepercayaan dan verifikasi. Kita tidak punya waktu sebanyak itu."

Angka-angkanya pun konkret. Berdasarkan data Anthropic sendiri, panjang tugas yang dapat diselesaikan AI secara otonom kira-kira berlipat ganda setiap beberapa bulan dalam beberapa tahun terakhir: Claude 3 Opus pada Maret 2024 mampu menyelesaikan pekerjaan sekitar 4 menit, pada Maret 2025 sekitar 1,5 jam, dan Claude Opus 4.6 pada Maret 2026 mampu menyelesaikan pekerjaan kontinu sekitar 12 jam. Perusahaan memperkirakan bahwa "tugas yang membutuhkan beberapa hari bagi seorang ahli dapat masuk dalam jangkauan dalam tahun ini" dan "tugas berskala beberapa minggu pun pada tahun 2027." Salah satu pendiri, Jack Clark, dilaporkan memperkirakan probabilitas otomatisasi penuh penelitian dan pengembangan oleh AI sebesar "sekitar 60% sebelum akhir 2028." Sementara itu, pesaing OpenAI dalam laporan terpisah mengambil posisi yang berbeda, menyatakan bahwa "bukan perusahaan swasta yang bertindak sendiri, melainkan pemerintah demokratislah yang pada akhirnya harus menentukan aturan, pengaman, dan mekanisme akuntabilitas" — menciptakan kontras yang jelas.

Bahaya "AI Terbaik" dan "Pendidik Terbaik" yang Mengarah pada RSI

Mari kita kembali ke tema utama tulisan ini. Model frontier terkuat (Mythos) dan pendidik terbaik yang unggul dalam efisiensi riset AI sekaligus demokratisasi pengetahuan AI (Karpathy) — keduanya mengarah pada RSI. Apa yang berbahaya dari kombinasi ini?

Pertama, soal kualitas kemampuan. Mythos telah melampaui manusia dalam kemampuan "menemukan dan mengeksploitasi kelemahan perangkat lunak." Esensi RSI pun tak lain adalah "menemukan, mengeksploitasi, dan memperbaiki kelemahan (inefisiensi) dalam cara membuat AI." Kecerdasan "pencari titik lemah" yang ditunjukkan dalam penemuan kerentanan, bila diarahkan pada arsitektur dan resep pelatihan dirinya sendiri, maka siklus perbaikan bisa berputar tanpa campur tangan manusia. Loop yang oleh Karpathy disebut "secuil kegilaan" dalam eksperimen di rumahnya — ketika dipersenjatai dengan model terkuat di dunia dan teknik penyetelan terbaik di dunia — akan membuat umpan balik menjadi jauh lebih cepat dari sebelumnya.

Kedua, soal pergeseran bottleneck. Seperti yang diakui Anthropic sendiri, semakin cepat AI menulis kode, semakin besar porsi tahap pembatas yang bergeser ke "ulasan oleh manusia." Jika ulasan tidak mampu mengimbangi kecepatan itu, wilayah di mana perbaikan terus bertumpuk tanpa dipahami manusia pun semakin meluas. Anthropic sendiri menyebut risiko bahwa "setiap generasi mengakumulasi misalignment secara majemuk" — dan itulah tepatnya poin ini. Pendidik terbaik sejatinya adalah ahli dalam "menerjemahkan ke dalam bentuk yang dapat dipahami manusia." Paradoksnya, sosok itulah yang justru berperan mempercepat loop yang berpotensi meninggalkan pemahaman manusia di belakang — di situlah "bahaya" yang dimaksud judul tulisan ini terangkum.

Ketiga, ada bahaya dalam struktur itu sendiri: kubu berhati-hati yang menekan akselerator. Karpathy yang dengan tenang mengatakan "AGI masih 10 tahun lagi" dan "kode yang ada sekarang masih slop" — begitu masuk ke garis terdepan, ia menjadi penanggung jawab implementasi RSI, tema yang paling akseleratif dari semuanya. Kehati-hatian dan akselerasi bisa berdampingan tanpa kontradiksi dalam diri satu orang yang sama. Karena itulah, bukan siapa yang memegang kendali yang dipertanyakan, melainkan seberapa cepat loop itu sendiri akan berputar. Anthropic menganjurkan perlambatan sekaligus merekrut pelaku RSI — bukan karena mereka merangkul kontradiksi. Fakta bahwa bahkan representasi kubu berhati-hati sekalipun bergerak ke posisi yang memutar engkol di garis terdepan itulah pertanda terkuat bahwa AGI mendekati kita lebih cepat dari perkiraan — dan alasan mengapa kekhawatiran soal rem kini berubah menjadi agenda yang nyata.

4 Pandangan tentang AGI — Page, Musk, Altman, Amodei

Mengapa sikap begitu terbelah antara perusahaan dan individu yang berbeda, meski mereka menghadapi "AI yang sama-sama kuat"? Jika kita telusuri akarnya, kita akan sampai pada filosofi empat orang yang telah lama mendefinisikan Silicon Valley.

Yang berada di kutub paling akselerasionis adalah Larry Page, salah satu pendiri Google. Menurut kesaksian di bawah sumpah yang diberikan Elon Musk dalam persidangan seputar OpenAI yang dimulai pada April 2026, "OpenAI ada karena Larry Page menyebutku 'speciesist' (diskriminasi antarspesies)." Ini adalah kisah yang juga digambarkan dalam biografi Walter Isaacson — Page konon menertawakan kemungkinan bahwa AI bisa menjadi ancaman eksistensial bagi umat manusia, dan mengkritik Musk yang memprioritaskan kelangsungan hidup manusia sebagai "rasis yang memihak spesies manusia." Bagi Page, kemunculan superkecerdasan digital justru merupakan langkah alami dan diinginkan berikutnya dalam evolusi, dan menempatkan privilese pada manusia sebagai spesies biologis itu sendiri adalah sesuatu yang picik — itulah pandangan dunianya. (Perlu dicatat bahwa Page sendiri hampir tidak pernah berbicara tentang hal ini di depan umum, dan kisah ini sebagian besar diketahui melalui kesaksian Musk dan biografi tersebut.)

Di kutub yang berlawanan adalah Musk. Ia bahkan berkata "I f---ing like humanity, dude," dan memprioritaskan keselamatan yang berpusat pada manusia di atas segalanya. Argumen konsistennya adalah bahwa perpecahan dengan Page menjadi salah satu motivasi untuk mendirikan OpenAI (2015) sebagai poros tandingan yang nirlaba dan terbuka. Gugatan yang ia ajukan pada 2024, yang menyatakan bahwa OpenAI telah mengkhianati kedok nirlabanya, mencapai puncaknya di pengadilan pada April 2026.

Di antara keduanya terdapat Sam Altman sebagai seorang gradualis. Dalam esainya "The Gentle Singularity" (Singularitas yang Lembut) dari Juni 2025, ia berpendapat bahwa kedatangan superkecerdasan tidak terhindarkan, namun ia akan datang "sedikit demi sedikit" bukan sebagai断絶 yang dahsyat, melainkan sebagai kurva yang mulus. Sambil menyatakan "kita sudah melewati cakrawala peristiwa; lepas landas telah dimulai," ia menggambarkan bahwa orang-orang akan tetap mencintai keluarga mereka, menikmati kreasi, dan berenang di danau — tekstur kehidupan sehari-hari adalah "mengesankan, namun dapat ditangani." Ini adalah argumen gradasi optimistis yang menawarkan garis waktu: agen yang menangani kerja kognitif nyata pada 2025, sistem yang menghasilkan wawasan baru pada 2026, robot yang bekerja di dunia nyata pada 2027.

Dan kemudian ada Dario Amodei. Ia tidak menyukai istilah "AGI" dan menyebutnya "powerful AI" (AI yang kuat). Ia memperkirakan ini bisa tiba seawal 2026, namun dalam esai panjangnya "Machines of Loving Grace" (Mesin-mesin yang Penuh Kasih) dari Oktober 2024, ia melukiskan masa depan yang sepenuhnya optimistis — bahwa jika kecerdasan setara Nobel menjadi "lebih cerdas dari manusia di semua bidang," maka penggandaan masa hidup, penyembuhan hampir semua penyakit, dan kemakmuran ekonomi yang besar semua berada dalam jangkauan. Namun pada Januari 2026, ia menyoroti sisi risiko dalam sekuel "The Adolescence of Technology" (Masa Remaja Teknologi), yang kemudian mengarah pada "rekomendasi perlambatan" di bulan Juni. Antusiasme terhadap manfaat dan kewaspadaan terhadap hilangnya kendali hidup berdampingan dalam diri orang yang sama — inilah sikap dasar Amodei, dan pada akhirnya Anthropic. Orang yang paling fasih berbicara tentang kegembiraan akselerasi juga menjadi orang yang paling keras menuntut pengereman. Ini bukan kontradiksi. Justru karena ia telah menginjak pedal gas lebih dalam dari siapa pun, ia paling awal menyadari bahwa AGI semakin mendekat lebih cepat dari perkiraan, dan mulai memikirkan tentang rem. Firasat "lebih cepat dari yang diperkirakan" inilah yang menjadi sumber "pergulatan" Anthropic.

Perspektif VC Silicon Valley――Mengapa "Perusahaan yang Menganjurkan Perlambatan" Bisa Melaju Sendiri

Dari sini, saya ingin mengintegrasikan serangkaian gerakan ini dari sudut pandang yang tidak ditemukan di situs lain — perspektif modal ventura (VC) Silicon Valley.

Pertama, mari kita konfirmasi "kepemimpinan" Anthropic dengan angka. Pada 28 Mei 2026, perusahaan ini berhasil mengumpulkan $65 miliar (sekitar 10 triliun yen) dalam putaran Seri H, dengan valuasi post-money mencapai $965 miliar (sekitar 150 triliun yen). Investor utamanya adalah Sequoia Capital, Altimeter, Dragoneer, Greenoaks, dengan co-lead dari dana-dana kelas dunia seperti Coatue, GIC, ICONIQ, dan Capital Group. Sebelumnya dalam Seri G, valuasinya sekitar $380 miliar (sekitar 59 triliun yen), sehingga valuasi lebih dari dua kali lipat hanya dalam beberapa bulan. Kemudian pada 1 Juni, perusahaan ini mengajukan S-1 (draf prospektus pencatatan) secara rahasia ke SEC, dan berlomba menuju IPO yang mendekati $1 triliun (sekitar 155 triliun yen). Run rate pendapatan (disetahunkan) telah mencapai sekitar $47 miliar (sekitar 7,3 triliun yen) pada Mei 2026, tumbuh sekitar 5 kali lipat dari sekitar $10 miliar (sekitar 1,6 triliun yen) tahun sebelumnya. Claude Code saja melonjak dari $1 miliar (sekitar 155 miliar yen) disetahunkan pada November 2025 menjadi $2,5 miliar (sekitar 390 miliar yen) pada Februari 2026. Inilah kepemimpinan yang benar-benar disebut sebagai "Dario menang".

Dalam dunia VC, ada hipotesis yang secara teoritis mendukung kepemimpinan ini. Jika RSI (Recursive Self-Improvement) benar-benar terwujud, maka putaran umpan balik "siklus penelitian semakin cepat → model fondasi semakin baik → Claude semakin cerdas → siklus penelitian semakin cepat" akan berputar, dan perusahaan pertama yang menangkapnya akan melompat jauh ke depan dengan cara yang tidak bisa dikejar pesaing — dinamika yang disebut *winner-take-all* (pemenang mengambil semua). Dari perspektif ini, akuisisi Karpathy bukan sekadar rekrutmen bintang, melainkan investasi dalam "seseorang yang dapat memutar putaran ini paling cepat" — dan itulah alasan rasional mengapa VC condong ke Anthropic. Jika kita mengingat bahwa Anthropic pada awalnya ditolak oleh banyak VC terkemuka (satu laporan menyebutkan "ditolak oleh 21 VC tingkat teratas"), besarnya fluktuasi valuasi itu sendiri mencerminkan asimetri taruhan ini.

Yang sangat menarik di sini adalah implikasi VC dari paradoks "mereka yang menyerukan perlambatan justru yang berlari paling kencang". Representatif terdepan kubu akselerasi Silicon Valley adalah Andreessen Horowitz (a16z). "Manifesto Techno-Optimist" dari pendirinya Marc Andreessen memuji kapitalisme tekno pasar bebas sebagai obat mujarab, dan menolak gagasan seperti "etika teknologi" dan "kepercayaan dan keamanan (*trust and safety*)". Mitra a16z, David Ulevitch, mengkritik sikap Amodei tentang kolaborasi dengan pemerintah, bahkan mengatakan eksekutif teknologi harus meninggalkan "kompleks Tuhan (*God complex*)". Anthropic/Amodei yang berorientasi pada perlambatan dan pengendalian, versus a16z yang berorientasi pada akselerasi dan kebebasan — pertentangan ini adalah gambaran di mana perbedaan pandangan tentang AGI langsung diterjemahkan ke dalam perbedaan filosofi investasi.

Namun sebagian VC membaca ini satu langkah lebih dalam. Jika pusat gravitasi industri bergeser dari "kecepatan kemampuan" ke "pengawasan, evaluasi, dan verifikasi (*governance*)", maka pemenangnya bukan pemilik kecepatan kemampuan murni, melainkan mereka yang menguasai alat verifikasi dan infrastruktur tata kelola — begitulah perkiraan mereka. Dari sudut pandang ini, "seruan perlambatan" Anthropic bukan sekadar ungkapan hati nurani, melainkan juga positioning strategis untuk merebut kepemimpinan dalam pembuatan aturan. Perusahaan yang paling keras memperingatkan RSI adalah yang paling cepat mengimplementasikan RSI, dan sekaligus mengajukan diri sebagai penggagas pembuatan aturannya. Akselerator, rem, dan perancangan peraturan lalu lintas — menggenggam ketiga hal ini dalam satu perusahaan itulah inti dari "kepemimpinan" Anthropic, sekaligus inti dari "pergumulannya". Namun seruan perlambatan dan kepemimpinan tidaklah bertentangan. Hanya mereka yang berlari paling cepat yang mengetahui secara langsung seberapa dekat garis finish (AGI), dan itulah mengapa mereka terburu-buru merancang rem. Fakta bahwa Anthropic mulai membicarakan rem secara serius itu sendiri merupakan bukti bahwa AGI datang lebih cepat dari yang diperkirakan. Sejauh mana mereka dapat mengendalikan "lebih cepat dari yang kita kira" ini di bawah gravitasi valuasi 150 triliun yen — itulah yang terus dipantau oleh para VC.

Hal-hal yang perlu diperhatikan ke depan――kapan dan apa yang "diukur"

Terakhir, mari kita rangkum apa yang perlu kita perhatikan dari sini, dan dalam rentang waktu seperti apa.

Indikator kuantitatif paling konkret adalah laju penggandaan "panjang tugas yang dapat diselesaikan AI secara otonom" yang ditunjukkan oleh Anthropic sendiri. Per Maret 2026, sekitar 12 jam. Perusahaan tersebut telah mengumumkan bahwa "tugas yang membutuhkan beberapa hari bagi seorang ahli akan masuk dalam jangkauan pada tahun ini (2026)" dan "akan mencapai skala beberapa minggu pada 2027." Apakah "siklus penggandaan panjang tugas" ini diperbarui setiap beberapa bulan sesuai prakiraan, atau justru melambat, akan menjadi barometer terbaik apakah RSI benar-benar sedang berakselerasi. Selain itu, yang perlu diamati adalah proporsi kode internal yang ditulis oleh Claude (sudah melampaui 80%), volume merge per insinyur (8 kali lipat dibanding 2024), dan sejauh mana peningkatan loop autoresearch dapat dialihkan dari model kecil ke skala garis terdepan.

Dari sisi manusia dan peristiwa: pertama, hasil apa yang akan dipublikasikan oleh tim Karpathy dalam pre-training. Kedua, seberapa dekat pencapaian pada 2026–2027 terhadap perkiraan Jack Clark bahwa "sekitar 60% otomatisasi penuh penelitian dan pengembangan pada akhir 2028." Ketiga, bagaimana "rekomendasi perlambatan" diterima oleh laboratorium riset utama lainnya dan pemerintah berbagai negara, dan seberapa jauh dalam beberapa bulan ke depan dialog menuju desain konkret mekanisme verifikasi (sistem untuk memastikan bahwa masing-masing pihak benar-benar berhenti) akan berkembang. Anthropic telah menyatakan akan melanjutkan konsultasi dengan pembuat kebijakan, peneliti, dan pesaing untuk sementara waktu. Keempat, sejauh mana ekspansi Project Glasswing dan Mythos akan meluas dari 15 negara dan 150 organisasi, dan bagaimana partisipasi lembaga EU seperti ENISA akan berdampak pada diskusi regulasi keamanan.

Dan sebagai peristiwa keuangan, kapan S-1 yang diajukan secara rahasia beralih menjadi prospektus resmi dan memasuki roadshow (presentasi investor) adalah momen paling krusial. Karena dalam sistem regulasi AS, prospektus resmi harus disampaikan kepada investor setidaknya 15 hari sebelum dimulainya roadshow, publikasi tersebut menjadi sinyal "dimulainya penghitung waktu pencatatan." Jika pencatatan yang mendekati 1 triliun dolar (sekitar 155 triliun yen) terwujud, ini akan menjadi pertama kalinya ekonomi pengembangan AI oleh AI (RSI) dinilai di pasar publik. Berapa nilai yang akan ditetapkan pasar bagi sebuah perusahaan yang berkhotbah tentang perlambatan namun terus melaju sendirian — pada paruh kedua 2026, sebagian jawaban atas pertanyaan itu seharusnya mulai terlihat.