xAI melancarkan Grok Build. Bersaing dengan Claude Code

xAI milik Elon Musk telah melancarkan "Grok Build" pada pertengahan Mei 2026 sebagai beta awal — CLI pengekodan agentik pertama yang serius. Dengan keupayaan sehingga 8 sub-ejen selari, mod Plan, dan reka bentuk yang mengutamakan tempatan (local-first), ia bertujuan untuk bersaing secara langsung dengan pasaran ejen pembangun yang kini dikuasai hampir sepenuhnya oleh Claude Code dari Anthropic. Pelabur modal teroka (VC) utama Silicon Valley meletakkan "coding agent" sebagai "pelaksanaan pertama AGI", namun penerimaan terhadap Grok Build menunjukkan campuran antara harapan dan keraguan.

Apakah itu Grok Build

Grok Build, yang diperkenalkan oleh xAI pada 14 Mei 2026 melalui blog rasmi bertajuk "Introducing Grok Build", merupakan sebuah "CLI agentik" yang beroperasi di dalam terminal pembangun. Syarikat tersebut memposisikan alat ini sebagai "ejen pengekodan dan CLI baharu yang berkuasa untuk kejuruteraan perisian profesional dan tugasan pengekodan yang kompleks." Pelbagai media termasuk Engadget, DevOps.com, dan CIO Dive melaporkannya sebagai "kutub keempat" yang setara dengan Claude Code dari Anthropic, Codex CLI dari OpenAI, dan Gemini Code Assist dari Google.

Titik masuk teknikalnya adalah mudah — pembangun melancarkan Grok Build dalam folder projek dan menerangkan tugasan menggunakan bahasa semula jadi. Ejen tersebut menganalisis struktur repositori, mengenal pasti fail-fail yang berkaitan, melaksanakan arahan shell, dan melakukan pengeditan merentasi pelbagai fail. Dengan CLI sebagai asas dan UI Web sebagai pilihan tambahan, rekabentuknya menghormati tabiat pembangun yang menggunakan terminal sebagai "meja kerja". Akses pada masa ini terhad kepada fasa beta awal untuk pelanggan SuperGrok Heavy berharga USD 300 sebulan (kira-kira RM 1,350), namun xAI turut menawarkan promosi diskaun 67% pada harga USD 99 sebulan (kira-kira RM 450) untuk enam bulan pertama, bertujuan menarik pengguna pesaing ke dalam ekosistem mereka sendiri.

Seiring dengan pelancaran ini, Elon Musk sendiri telah beberapa kali menyiarkan "undangan kepada penguji beta awam" di X (dahulunya Twitter), berkongsi panduan penggunaan Grok Build dan mempromosikannya secara peribadi. Ini juga merupakan saat yang memperjelaskan strategi dua hala xAI — di mana model serbaguna Grok 4.3 menangani keperluan umum dan perusahaan, manakala Grok Build 0.1 menguasai domain pembangun dan ejen.

Ciri-ciri Terperinci dan Seni Bina Teknikal

Ciri utama Grok Build ialah keupayaannya menjalankan sehingga 8 sub-ejen selari secara serentak melalui aliran kerja tiga peringkat: Rancang (Plan) → Cari (Search) → Bina (Build). Menurut penjelasan teknikal sdd.sh, setiap sub-ejen disepadukan dengan ciri worktree Git, membolehkan eksperimen dijalankan pada cawangan bebas sebelum digabungkan ke dalam pokok kerja utama. Secara dalaman di xAI, crate bernama "xai-fast-worktree" memanfaatkan subvolum btrfs untuk menjana worktree berasaskan copy-on-write dengan pantas, sekali gus menghalang secara struktur sebarang konflik fail antara berbilang ejen.

Tiang kedua ialah mod Rancang (Plan Mode). Untuk tugasan yang kompleks, Grok Build terlebih dahulu mempersembahkan pelan pelaksanaan lengkap yang merangkumi fail yang akan diubah, operasi yang akan dilakukan pada setiap fail, serta alasan di sebaliknya. Pembangun boleh meluluskan, mengulas, atau menulis semula pelan tersebut sepenuhnya — dan hanya selepas kelulusan barulah satu baris kod pun akan disentuh. Ini merupakan jawapan xAI kepada isu kepercayaan yang melanda ejen pengekodan secara umum, iaitu "AI yang tanpa sedar merosakkan fail".

Tiang ketiga ialah mod Arena, namun setakat Februari 2026, walaupun kesannya telah ditemui dalam pangkalan kod, ia masih belum diaktifkan dalam versi beta awal yang diterbitkan. Apabila siap, ia akan berfungsi sebagai lapisan penilaian yang mencetak skor dan menyusun kedudukan output berbilang ejen yang berjalan secara selari secara automatik, memilih "penyelesaian terbaik" sebelum pembangun membuat semakan. xAI telah menyatakan secara jelas bahawa ciri ini akan "ditambah tidak lama lagi", dan penganalisis industri memandang pelaksanaan mod Arena sebagai kunci pembezaan Grok Build.

Tiang keempat ialah reka bentuk privasi. Grok Build mengutamakan pendekatan "tempatan dahulu (local-first)", dengan struktur yang tidak menghantar kod sumber pengguna ke pelayan xAI semasa sesi berlangsung. Semua kod dilaksanakan pada mesin pembangun sendiri, menjadikannya sesuai untuk persekitaran air-gap dan industri yang dikawal selia. Kenyataan bahawa ia tidak memerlukan infrastruktur perusahaan yang kompleks seperti penggunaan Anthropic melalui AWS Bedrock telah menarik minat awal daripada syarikat-syarikat yang mengendalikan pangkalan kod sensitif, seperti institusi kewangan, pertahanan, dan penjagaan kesihatan.

Keserasian ekosistem turut diberi perhatian. Grok Build memiliki mekanisme untuk mencari dan mendedahkan pelayan Model Context Protocol (MCP) secara automatik sebagai alat kepada ejen, serta membaca format Skills yang serasi dengan Anthropic. Selain itu, ia mengenali fail CLAUDE.md untuk Claude Code mahupun fail AGENTS.md yang merupakan konvensyen merentas vendor. Falsafah reka bentuk yang membolehkan penyambungan terus pangkalan pengetahuan dalaman, API proprietari, dan get laluan MCP korporat sebagai "Bring Your Own MCP" jelas bertujuan untuk menarik pengguna daripada ekosistem Claude Code.

Dari segi prestasi, Grok Build menggunakan grok-code-fast-1 sebagai model asas. Ia memiliki tetingkap konteks 256,000 token, skor 70.8% pada SWE-Bench Verified, dengan harga API yang ditetapkan pada $0.20 (kira-kira ¥30) per juta token input dan $1.50 (kira-kira ¥225) per juta token output — tahap yang amat agresif berbanding Claude Opus 4.7. Perlu diambil perhatian bahawa xAI telah mengumumkan secara rasmi pada 15 Mei bahawa grok-code-fast-1 telah ditandakan sebagai tidak disyorkan (deprecated), dengan jadual penutupan penuh pada 15 Ogos 2026. Ini mencadangkan penghijrahan ke model pengganti, yang dalam industri dijangkakan sebagai "Grok Code Fast 2" atau terbitan pengekodan berasaskan Grok 5.

Kekuatan dan Logik Cabaran terhadap "Dominasi Tunggal Claude Code"

Claude Code daripada Anthropic telah mencapai hasil jualan tahunan (ARR) sebanyak $2.5 bilion (kira-kira ¥375 bilion) dalam tempoh 9 bulan sejak ia mula ditawarkan secara umum pada Mei 2025, dan telah berkembang hingga menyumbang lebih separuh daripada hasil jualan perusahaan keseluruhan produk Anthropic. Menurut analisis daripada SaaStr dan sumber lain, ARR keseluruhan syarikat Anthropic mencecah $14 bilion (kira-kira ¥2.1 trilion) pada April 2026, dan dari segi kadar penggunaan AI perusahaan pada Mei tahun yang sama, Anthropic mencatatkan 34.4% berbanding OpenAI 32.3%, menandakan buat pertama kalinya Anthropic merampas tempat teratas. Claude Code diiktiraf sebagai "aplikasi pembunuh bertaraf ChatGPT" dalam landskap ini.

Berhadapan dengan struktur sedemikian, strategi kemenangan yang diketengahkan oleh Grok Build merangkumi empat perkara: harga dan keselarian, privasi, serta integrasi menegak secara bebas oleh xAI. Harga promosi $99 sebulan jelas lebih murah berbanding pelan setara Claude Code, menjadikannya lebih mudah dicuba oleh pembangun secara individu. Seni bina 8 sub-agen selari berpotensi menawarkan pengalaman pembangunan yang berbeza secara kualitatif berbanding Claude Code yang berpusat kepada ejen tunggal — iaitu "mencuba tugasan yang sama dengan pelbagai penyelesaian secara selari, kemudian mengekstrak cadangan terbaik melalui penilaian automatik." Reka bentuk yang mengutamakan tempatan (local-first) menjadi laluan terus untuk menembusi sektor industri yang dikawal selia ketat. Selain itu, hakikat bahawa xAI memiliki infrastruktur pengkomputeran sendiri yang terbesar dalam industri — Memphis Colossus (555,000 unit GPU NVIDIA, bernilai $18 bilion atau kira-kira ¥2.7 trilion, kapasiti 2 gigawatt) — memberi ruang untuk mengawal kos inferens secara dalaman dalam jangka panjang, sesuatu yang membawa implikasi strategik yang amat besar.

Berdasarkan laporan awal, media yang menyasarkan pembangun seperti Techloy melaporkan bahawa "Grok Build mengatasi Claude Code dalam tugasan autonomi, dan terdapat penanda aras awal yang menunjukkan ketepatan penjanaan kod setara dengan Codex CLI." Elon Musk sendiri telah berkongsi semula di X ulasan pengguna yang menyebut "CLI mesra tetikus" dan "boleh bergerak antara pelbagai ejen untuk menyemak rancangan", dan ia berjaya mendapat perhatian tertentu di media sosial.

Kelemahan yang Tertinggal dan Kedalaman Struktur "Satu Kuasa Dominan"

Namun demikian, ulasan terperinci dari sdd.sh dan Beginners in AI menganalisis secara tenang bahawa Grok Build masih belum berada pada tahap yang boleh segera mengancam kedudukan Claude Code. Kelemahan terbesar adalah jurang penanda aras, di mana angka 70.8% dalam SWE-Bench Verified ketinggalan hampir 17 mata peratusan berbanding Claude Opus 4.7 yang mencapai 87.6%. Anthropic sendiri telah membuktikan melalui penggunaan dalaman bahawa "70~90% daripada kod yang dihasilkan oleh pasukan kejuruteraan mereka datang daripada Claude Code," dan mereka sedang berada dalam gelung maklum balas yang terus meningkatkan prestasi melalui penggunaan produk mereka sendiri secara dalaman.

Jurang pada lapisan tadbir urus perusahaan juga amat ketara. Claude Code dilengkapi dengan penyediaan SCIM, Analytics API, kawalan perbelanjaan peringkat pengguna, eksport OpenTelemetry, serta fungsi pelaksanaan berjadual di awan melalui Routines (pencetus cron, webhook API, pencetus acara GitHub — boleh dilaksanakan tanpa perlu menghidupkan mesin pengguna). Semua ini tidak wujud dalam Grok Build pada masa ini. Mekanisme pengekodan peraturan merentas organisasi yang setara dengan CLAUDE.md memang hadir dalam bentuk AGENTS.md, namun ia jauh lebih lemah dari segi ketebalan ekosistem. Claude Code mempunyai rekod integrasi dengan lebih daripada 6,400 pelayan MCP (termasuk Jira, Figma, Salesforce dan sebagainya), manakala PwC sedang menggerakkan Claude Code dalam skala ratusan ribu pengguna dan telah memulakan latihan untuk 30,000 orang. Dijangkakan Grok Build memerlukan masa yang agak lama untuk memperoleh ketumpatan pihak ketiga yang setara.

Tembok reputasi juga tidak boleh diabaikan. Menurut AI Index Netskope (sehingga Mei 2026), ChatGPT dan Claude telah mendapat penggunaan meluas dalam organisasi, manakala Grok kekal terhad dalam penggunaan perniagaan. Tambahan pula, pada Januari 2026, Center for Countering Digital Hate (CCDH) mempersoalkan jutaan deepfake seksual yang dijana menggunakan alat imej Grok, menyebabkan Indonesia dan Malaysia menyekat perkhidmatan berkenaan, dan Kesatuan Eropah memulakan siasatan berdasarkan Digital Services Act. Bagi bahagian perolehan perusahaan, risiko jenama seperti ini masih menjadi halangan yang besar.

Persepsi VC Silicon Valley

Sequoia Capital, firma modal teroka terbesar di Silicon Valley, telah secara jelas memposisikan ejen pengekodan sebagai "contoh konkrit pertama AGI" dalam esei Januari 2026 bertajuk "2026: This is AGI" oleh Pat Grady dan Sonya Huang. Mereka meramalkan bahawa "pengekodan dan ChatGPT adalah dua aplikasi pembunuh utama AI, dan pada tahun 2026, kedua-duanya akan mendekati atau melebihi hasil pendapatan berbilion dolar dua digit," dengan Grok Build dilihat sebagai kemasukan lewat xAI ke dalam struktur ini. Sequoia menggambarkan ekonomi ejen sebagai "peluang bernilai trilion dolar," menekankan perubahan struktur di mana ejen AI menyasarkan "belanjawan buruh (enam kali lebih besar) berbanding belanjawan perisian." Sama ada Grok Build mampu menembusi kumpulan belanjawan ini masih tidak pasti — itulah penilaian tenang daripada mereka yang mengenali syarikat tersebut.

Andreessen Horowitz (a16z) telah menumpukan dana $3.4 bilion (kira-kira ¥510 bilion) pada Januari 2026 ke dalam "aplikasi dan infrastruktur AI," menunjukkan keyakinan yang kuat dengan mengetuai pusingan Siri A, B, dan C secara berturutan untuk Anysphere, syarikat induk Cursor. Pada April 2026, Cursor sedang dalam proses pusingan pembiayaan melebihi $2 bilion (lebih ¥300 bilion) yang dipimpin bersama oleh a16z dan Thrive Capital pada penilaian $50 bilion (kira-kira ¥7.5 trilion), dengan Nvidia menyertai sebagai pelabur strategik. Marc Andreessen dari a16z menyatakan dalam podcast Joe Rogan bahawa "bot tidak marah, tidak mabuk, tidak sakit, dan tidak mengemukakan aduan HR," menegaskan kedudukan yang menekankan kebolehgantian ejen AI. Walaupun beliau mungkin mempunyai kedudukan pelaburan tidak langsung dalam xAI itu sendiri, tiada komen rasmi mengenai Grok Build yang diperhatikan, dan dari perspektif a16z, kedudukan pelaburan dalam Cursor dan Anthropic sebenarnya menjana keuntungan belum direalisasi melalui pengembangan ekosistem ekonomi Claude Code.

Accel telah menubuhkan dana AI baharu bernilai $5 bilion (kira-kira ¥750 bilion) berdasarkan pulangan belum direalisasi daripada Anthropic (nilai buku pelaburan $183 bilion = kira-kira ¥27.5 trilion kini meningkat kepada hampir $800 bilion = kira-kira ¥120 trilion) dan Cursor (daripada penilaian $9.3 bilion = kira-kira ¥1.4 trilion kepada $50 bilion). Bagi VC seperti Accel yang mempunyai kedudukan pelaburan sedia ada, kemunculan Grok Build adalah suatu peristiwa yang bermaksud dua: ia disambut baik kerana merelatifkan "dominasi Claude Code" dengan menambah pilihan model alternatif untuk Cursor, namun pada masa yang sama dilihat sebagai tekanan jangka pendek terhadap penilaian Anthropic. Malah, VentureBeat telah melaporkan bahawa Anthropic mengambil langkah untuk menyekat akses model Claude secara berperingkat kepada Cursor dan Windsurf antara 2025 dan 2026, yang secara pasti mengurangkan pilihan "berbilang model" bagi lapisan alat pengekodan bebas. Grok Build adalah lambang strategi xAI untuk memegang lapisan CLI dengan model proprietarinya sendiri, dan VC sedang mengesahkan trend penyatuan pasaran ejen pengekodan ke dalam timbunan integrasi menegak "OpenAI / Anthropic / Google / xAI / Cursor+Windsurf / GitHub Copilot."

Menurut agregasi Sourcery Intel dan Gartner, pasaran ejen pengekodan AI untuk perusahaan pada April 2026 berskala kadar tahunan $9.8 bilion hingga $11 bilion (kira-kira ¥1.5 trilion hingga ¥1.7 trilion), dengan keseluruhan pasaran alat pengekodan AI dalam erti kata yang lebih luas mencapai $12.8 bilion (kira-kira ¥1.9 trilion). Grand View Research meramalkan pasaran ini akan berkembang kepada $139.2 bilion (kira-kira ¥20.9 trilion) menjelang 2034, dengan kadar pertumbuhan tahunan sebanyak 40.5%. Di hadapan TAM yang besar ini, VC arus perdana Silicon Valley menyambut Grok Build sebagai "pemangkin pengembangan pasaran," namun oleh kerana xAI sendiri mempunyai kedudukan pelaburan yang lebih nipis berbanding Anthropic atau Cursor dari perspektif a16z dan Sequoia, kejayaan xAI dalam domain pengekodan sebenarnya mungkin menjadi faktor pencairan portfolio mereka sendiri. Oleh itu, penilaian adalah tenang, dengan "subejen selari dan mod Arena menarik dari segi reka bentuk, tetapi halangan untuk melepasi Claude Code dalam kedua-dua penanda aras dan tadbir urus korporat adalah tinggi" (sdd.sh) menjadi pandangan umum penganalisis industri.

Nada Pelaporan Media Utama

Engadget melaporkan secara ringkas dan faktual bahawa "xAI telah melancarkan ejen pengekodan yang bersaing dengan Claude Code, eksklusif untuk SuperGrok Heavy (USD 300 sebulan)." DevOps.com memposisikannya sebagai "penyertaan xAI dalam perlumbaan ejen pengekodan," manakala Techloy, sebuah penerbitan industri untuk pembangun, melaporkannya dengan pendekatan yang agak bersemangat bertajuk "6 Senjata yang Disediakan Grok Build untuk Mengalahkan Claude Code." Bahagian komen Slashdot didominasi oleh suara-suara jurutera yang skeptikal, namun terdapat juga ramai yang menyambut baik reka bentuk local-first Grok Build.

CIO Dive menyampaikan penilaian berperspektif CIO dan pengurus perolehan dengan menyatakan bahawa "Grok Build memfokuskan pada aliran pembangunan plan, review, dan change, tetapi pesaing menawarkan skop aplikasi yang lebih luas untuk perusahaan" dan "dalam kajian Gartner, 80% CEO menyatakan bahawa alat AI agentik akan membawa perubahan bermakna kepada keupayaan operasi." Dalam artikel yang sama, penyebutan bahawa PwC telah menggunakan Claude Code kepada ratusan ribu pengguna di seluruh Amerika Syarikat secara tidak langsung menekankan kukuhnya kedudukan Claude Code di pasaran.

VentureBeat mengambil konteks peringatan risiko "lock-in" yang ditimbulkan oleh Managed Agents Anthropic untuk menempatkan kemunculan Grok Build secara relatif, dan memberi amaran tentang "penyusutan lapisan bebas dalam era berbilang model." Fortune, sambil memetik kata-kata CEO Cursor Michael Truell, melaporkan bahawa "Cursor sedang bersaing secara langsung dengan Claude Code — Anthropic menggunakan kelebihan kewangan dan kekuatan sebagai penyedia model untuk menawarkan harga yang lebih rendah," dan menggambarkan Grok Build sebagai perubahan struktur yang menjadikan xAI turut serta dalam pertempuran ini. Entri stub Wikipedia untuk Grok Build mencatat pelancaran pada 14–15 Mei sebagai rekod rasmi dan menyenaraikan metrik SWE-Bench Verified 70.8% sebagai fakta utama.

Setakat penulisan artikel ini (awal Jun 2026), tiada ulasan tunggal mengenai Grok Build yang ditemui daripada media peringkat pertama seperti Bloomberg, Reuters, Wall Street Journal, Financial Times, atau Nikkei. Media-media ini melaporkan terutamanya tentang pergerakan di peringkat syarikat induk, seperti pengambilalihan xAI oleh SpaceX (Februari 2026, penilaian xAI USD 250 bilion ≈ 37.5 trilion yen, jumlah penilaian USD 1.25 trilion ≈ 188 trilion yen) dan pusingan Siri E (Januari 2026, pengumpulan USD 20 bilion ≈ 3 trilion yen, penilaian USD 230 bilion ≈ 34.5 trilion yen). Artikel penilaian untuk Grok Build itu sendiri tertumpu di media pakar untuk pembangun dan media VC serta analis. Ini selari dengan penilaian pasaran bahawa "Grok Build belum cukup matang sebagai produk untuk menjadi subjek liputan B2B."

Pergerakan yang dijangkakan pada masa hadapan

xAI telah menyatakan secara jelas bahawa mereka akan "menerbitkan Nota Keluaran harian" semasa fasa beta awal Grok Build, dan laman berita untuk pembangun seperti Basenor sudah pun menjejaki ini secara berterusan. Isu-isu yang akan dipantau oleh para analis dan VC dalam tempoh 3 hingga 6 bulan akan datang adalah jelas. Pertama, bila Arena mode akan dilancarkan secara langsung, dan kualiti penilaian automatiknya. Jika ini berfungsi, aliran kerja "penilaian automatik pelbagai calon + pemilihan" akan menjadi pilihan yang berbeza secara kualitatif berbanding aliran kerja ejen tunggal Claude Code. Kedua, sama ada model pengganti grok-code-fast-1 mampu mencapai peringkat 80-an pada SWE-Bench Verified, dengan fokus pada sama ada model terbitan berasaskan Grok 5 — yang didakwa oleh Musk menghampiri tahap AGI — akan muncul menjelang musim luruh. Ketiga, bilangan pelayan MCP yang terkumpul dan pengembangan penyambung perusahaan, termasuk jadual penerbitan peta jalan untuk ciri tadbir urus seperti SAML/SCIM. Keempat, tarikh keluaran binaan natif Windows, yang disenaraikan dalam peta jalan xAI namun tiada tarikh rasmi diberikan.

Selain itu, peristiwa kewangan yang perlu diperhatikan ialah penutupan akhir pusingan pembiayaan Cursor sebanyak 2 bilion dolar (dijangkakan pada S2–S3 2026), serta pergerakan Anthropic daripada Series G sebelumnya pada penilaian 380 bilion dolar (kira-kira 57 trilion yen) menuju pusingan seterusnya. Sama ada jangkauan awal Grok Build secara tidak langsung mempengaruhi angka-angka ini merupakan isu yang menarik. Sekiranya Grok Build berjaya merekrut 10,000 pembangun melalui SuperGrok Heavy semasa fasa beta, itu akan menjadi angka yang bermakna sebagai tapak asas strategi B2D (Business to Developer) xAI.

Satu lagi faktor yang tidak menentu ialah struktur organisasi xAI selepas pengambilalihan oleh SpaceX. Menurut CNBC dan TechCrunch, lebih 50 penyelidik dan jurutera meninggalkan syarikat selepas pengambilalihan, dan xAI telah menyusun semula kepada empat pasukan pembangunan utama. Di bawah kepimpinan Michael Nicolls, bekas Naib Presiden Starlink yang kini menjawat jawatan Presiden xAI, sama ada Grok Build akan terus menerima pelaburan yang stabil dari segi sumber merupakan isu yang akan terus dipantau oleh VC. Sementara Memphis Colossus menuju ke arah konfigurasi 1 juta GPU, persoalannya ialah sama ada strategi "pengkomputeran yang luar biasa" xAI akan berfungsi sebagai senjata dalam domain pengekodan juga, atau sama ada skala itu akan sia-sia di hadapan strategi Anthropic iaitu "pembenaman mendalam ke dalam lapisan aplikasi". VC utama Silicon Valley mengiktiraf Grok Build sebagai "cabaran serius pertama kepada dominasi mutlak Claude Code", namun mereka berpandangan bahawa penghakiman menang atau kalah perlu menunggu sekurang-kurangnya sehingga akhir 2026, dan secara realistiknya, bergantung pada pengumpulan penanda aras dan rekod penggunaan pada separuh pertama 2027.