Ringkasan

Meta telah mendedahkan peta jalan empat generasi siri cip AI buatan sendiri mereka, "MTIA". Keempat-empat cip iaitu MTIA 300 (sedang dalam pengeluaran besar-besaran), 400 "Iris" (peringkat ujian makmal), 450 "Arke", dan 500 "Astrid" akan dikeluarkan setiap kira-kira 6 bulan sekali. Berasaskan seni bina RISC-V dalam kerjasama dengan Broadcom dan TSMC, reka bentuk ini khusus untuk inferens AI generatif bagi mengurangkan kebergantungan terhadap GPU Nvidia. Walau bagaimanapun, Nvidia Blackwell masih digunakan untuk tujuan latihan, menjadikan strategi ini bukan "penggantian" tetapi "kepelbagaian".

Teks utama

Meta mengumumkan peta jalan komprehensif untuk cip inferens AI buatan sendiri, "MTIA" (Meta Training and Inference Accelerator), pada 19 Mac 2026. Rancangan ini melibatkan pelancaran empat generasi secara berperingkat — MTIA 300, 400 "Iris", 450 "Arke", dan 500 "Astrid" — dengan kitaran pelepasan kira-kira setiap 6 bulan. Pemberian nama kod bagi setiap generasi mencerminkan bahawa Meta memposisikan barisan cip ini bukan sebagai eksperimen sementara, tetapi sebagai asas perniagaan jangka panjang.

MTIA 300 — Generasi Pertama yang Memasuki Fasa Pengeluaran Besar-besaran

Model pertama, MTIA 300, telah pun memasuki fasa pengeluaran besar-besaran dan sedang beroperasi di pusat data dalaman Meta. Ia memproses beban kerja inferens AI generatif untuk perkhidmatan utama seperti Facebook, Instagram, dan WhatsApp, dengan Meta mendakwa prestasinya melebihi GPU Nvidia dari segi prestasi per watt. Bagi Meta yang menyediakan perkhidmatan AI kepada berbilion pengguna, pengoptimuman kos inferens merupakan keutamaan tertinggi yang secara langsung mempengaruhi perbelanjaan infrastruktur.

MTIA 400 "Iris" — Cip Dalaman Pertama yang Bersaing dengan Produk Komersial

MTIA 400 "Iris", yang kini dalam fasa ujian makmal, merupakan pencapaian penting bagi Meta. Syarikat ini memposisikannya sebagai "cip pertama yang mampu bersaing dengan produk komersial terkemuka di pasaran dari segi prestasi mentah (raw performance)." Ini bermakna, jika MTIA 300 mengandalkan "kecekapan kos melalui pengoptimuman beban kerja dalaman", Iris pula menyasarkan tahap yang setanding dengan GPU Nvidia dari segi prestasi mutlak.

MTIA 450 "Arke" — Penggandaan Lebar Jalur

Pada MTIA 450 "Arke", lebar jalur HBM (High Bandwidth Memory) digandakan berbanding MTIA 400. Meta menggambarkan lebar jalur ini sebagai "jauh lebih tinggi daripada produk komersial terkemuka yang sedia ada (much higher than existing leading commercial products)", dengan tujuan untuk mengatasi masalah lebar jalur memori sebagai kesesakan dalam inferens model bahasa besar. Dalam inferens AI generatif, data pemberat model perlu dimuatkan dengan pantas daripada memori, dan peluasan lebar jalur secara langsung meningkatkan kelajuan inferens.

MTIA 500 "Astrid" — Kemuncak Peta Jalan

Butiran MTIA 500 "Astrid", generasi terakhir dalam peta jalan, masih terhad, tetapi ia dikatakan akan memajukan lagi seni bina lebar jalur tinggi yang ditetapkan oleh Arke. Jika Meta dapat mengekalkan kitaran pelepasan setiap 6 bulan, Astrid dijangka hadir pada lewat 2027 hingga awal 2028.

Asas Teknologi — RISC-V, Broadcom, TSMC

Dari segi teknikal, siri MTIA menggunakan seni bina RISC-V. RISC-V ialah seni bina set arahan (ISA) sumber terbuka yang bebas lesen dan sangat boleh disesuaikan. Ini membolehkan reka bentuk unik yang tidak terikat kepada cip berasaskan Arm atau ekosistem CUDA Nvidia. Pembuatan cip dikendalikan oleh TSMC, manakala kerjasama rapat dengan Broadcom telah dibina dalam reka bentuknya. Kitaran pelepasan generasi baharu setiap 6 bulan ini lebih agresif daripada kitaran pelepasan tahunan Nvidia.

Implikasi Strategik Tumpuan Inferens — "Kepelbagaian", Bukan "Penggantian"

Yang penting, MTIA memberi tumpuan kepada inferens, bukan latihan (training). GPU generasi Blackwell Nvidia masih digunakan untuk melatih model AI, dan Meta akan terus membeli GPU daripada Nvidia dan AMD. MTIA bukan strategi "penggantian Nvidia" tetapi "kepelbagaian (diversification)" — memindahkan sebahagian beban kerja inferens kepada cip dalaman bagi mengurangkan risiko pergantungan kepada pembekal sekaligus mengoptimumkan kos.

Pendekatan "kepelbagaian" ini bukan unik kepada Meta. Google meliputi latihan dan inferens melalui TPU (Tensor Processing Unit), manakala Amazon menggunakan Trainium untuk latihan dan Inferentia untuk inferens sebagai cip dalaman. Microsoft juga sedang membangunkan cip Maia. Trend hyperscaler yang memfokuskan pembangunan cip inferens AI dalaman mereka sendiri adalah jelas, dan pengurangan pergantungan mutlak kepada GPU Nvidia telah menjadi hala tuju seluruh industri.

Kesan Terhadap Industri

Peta jalan MTIA Meta berpotensi membawa perubahan struktur kepada pasaran semikonduktor AI yang dikuasai Nvidia. Berikutan Google (TPU), Amazon (Trainium/Inferentia), dan Microsoft (Maia), strategi cip tersendiri Meta yang dilancarkan secara serius dijangka akan mengurangkan nisbah perolehan GPU Nvidia dalam kalangan hyperscaler dalam jangka masa sederhana hingga panjang.

Penggunaan RISC-V juga merupakan titik peralihan penting bagi keseluruhan industri semikonduktor. Dengan penggunaan RISC-V dalam kategori cip inferens AI yang mempunyai permintaan tinggi, ekosistem seni bina tersebut berpotensi berkembang dengan pesat.

Walau bagaimanapun, risiko tetap wujud. Pembangunan cip tersendiri memerlukan pelaburan yang sangat besar, dan dalam persekitaran di mana seni bina model AI berkembang dengan pantas, risiko perkakasan menjadi lapuk sentiasa ada. Sama ada Meta benar-benar mampu mengekalkan peta jalan yang bercita-cita tinggi dengan kitaran enam bulan akan menjadi kunci kepada kejayaan atau kegagalan strategi ini.


Maklumat rujukan: Pengumuman pasukan semikonduktor AI Meta, perkembangan RISC-V International, laporan analisis pasaran inferens AI, data perbandingan Google TPU dan Amazon Trainium