Tóm tắt
Meta đã công bố lộ trình 4 thế hệ cho dòng chip AI tự phát triển "MTIA". Bốn chip gồm MTIA 300 (đang sản xuất hàng loạt), 400 "Iris" (đang thử nghiệm trong phòng lab), 450 "Arke" và 500 "Astrid" sẽ được phát hành với chu kỳ khoảng 6 tháng một lần. Các chip này được thiết kế dựa trên kiến trúc RISC-V, phát triển hợp tác với Broadcom và TSMC, tập trung vào suy luận AI tạo sinh nhằm giảm sự phụ thuộc vào GPU của Nvidia. Tuy nhiên, Nvidia Blackwell vẫn tiếp tục được sử dụng cho mục đích huấn luyện — đây là chiến lược "đa dạng hóa" chứ không phải "thay thế".
Nội dung
Meta đã công bố lộ trình toàn diện cho chip suy luận AI tự phát triển mang tên "MTIA" (Meta Training and Inference Accelerator) vào ngày 19 tháng 3 năm 2026. Kế hoạch bao gồm bốn thế hệ: MTIA 300, 400 "Iris", 450 "Arke" và 500 "Astrid", được ra mắt lần lượt theo chu kỳ phát hành khoảng 6 tháng một lần. Việc mỗi thế hệ được đặt tên mã riêng cho thấy Meta định vị dòng chip này không phải là một thử nghiệm tạm thời, mà là nền tảng kinh doanh dài hạn.
MTIA 300 — Thế hệ đầu tiên bước vào giai đoạn sản xuất đại trà
Mẫu đầu tiên, MTIA 300, đã bước vào giai đoạn sản xuất đại trà và đang hoạt động thực tế tại các trung tâm dữ liệu nội bộ của Meta. Chip này xử lý khối lượng công việc suy luận AI tạo sinh cho các dịch vụ chủ lực như Facebook, Instagram và WhatsApp, và Meta khẳng định hiệu năng trên mỗi watt vượt trội so với GPU của Nvidia. Đối với Meta — đơn vị cung cấp dịch vụ AI cho hàng tỷ người dùng — việc tối ưu hóa chi phí suy luận là ưu tiên hàng đầu gắn trực tiếp với chi tiêu hạ tầng.
MTIA 400 "Iris" — Chip tự sản xuất đầu tiên cạnh tranh với sản phẩm thương mại
MTIA 400 "Iris", hiện đang trong giai đoạn thử nghiệm phòng lab, đánh dấu một cột mốc quan trọng đối với Meta. Công ty định vị chip này là "chip đầu tiên có thể cạnh tranh với các sản phẩm thương mại dẫn đầu thị trường về hiệu năng thô (raw performance)". Nói cách khác, trong khi MTIA 300 lấy "hiệu quả chi phí nhờ tối ưu hóa cho khối lượng công việc nội bộ" làm lợi thế, thì Iris hướng tới mức hiệu năng tuyệt đối có thể sánh ngang GPU của Nvidia.
MTIA 450 "Arke" — Băng thông tăng gấp đôi
Với MTIA 450 "Arke", băng thông HBM (High Bandwidth Memory) tăng gấp đôi so với MTIA 400. Meta mô tả băng thông này là "vượt xa các sản phẩm thương mại hàng đầu hiện có (much higher than existing leading commercial products)", nhằm giải quyết triệt để vấn đề băng thông bộ nhớ trở thành nút thắt cổ chai trong quá trình suy luận của các mô hình ngôn ngữ lớn. Trong suy luận AI tạo sinh, dữ liệu trọng số mô hình cần được nạp nhanh từ bộ nhớ, do đó mở rộng băng thông trực tiếp cải thiện tốc độ suy luận.
MTIA 500 "Astrid" — Đỉnh cao của lộ trình
Chi tiết về thế hệ cuối cùng trong lộ trình, MTIA 500 "Astrid", vẫn còn hạn chế, nhưng được cho là sẽ phát triển thêm kiến trúc băng thông cao đã được thiết lập với Arke. Nếu Meta duy trì được chu kỳ phát hành 6 tháng một lần, Astrid sẽ ra mắt vào cuối năm 2027 đến đầu năm 2028.
Nền tảng kỹ thuật — RISC-V, Broadcom, TSMC
Về mặt kỹ thuật, dòng MTIA sử dụng kiến trúc RISC-V — một kiến trúc tập lệnh (ISA) mã nguồn mở, không yêu cầu phí bản quyền và có khả năng tùy chỉnh cao. Điều này cho phép thiết kế độc lập, không bị ràng buộc bởi chip nền Arm hay hệ sinh thái CUDA của Nvidia. Chip được sản xuất bởi TSMC, và mối quan hệ hợp tác sâu sắc với Broadcom được xây dựng trong khâu thiết kế. Chu kỳ ra mắt thế hệ mới tích cực mỗi 6 tháng nhanh hơn chu kỳ phát hành hàng năm của Nvidia.
Ý nghĩa chiến lược của việc tập trung vào suy luận — "Đa dạng hóa" chứ không phải "thay thế"
Điểm quan trọng là MTIA tập trung vào suy luận (inference) chứ không phải huấn luyện (training). GPU thế hệ Blackwell của Nvidia vẫn được sử dụng để huấn luyện các mô hình AI, và Meta sẽ tiếp tục mua GPU từ cả Nvidia lẫn AMD. MTIA là chiến lược "đa dạng hóa (diversification)" chứ không phải "thay thế Nvidia" — bằng cách chuyển một phần khối lượng công việc suy luận sang chip tự sản xuất, Meta đồng thời theo đuổi việc giảm rủi ro phụ thuộc nhà cung cấp và tối ưu hóa chi phí.
Cách tiếp cận "đa dạng hóa" này không phải riêng của Meta. Google bao phủ cả huấn luyện lẫn suy luận với TPU (Tensor Processing Unit), Amazon tự sản xuất chip với Trainium cho huấn luyện và Inferentia cho suy luận. Microsoft cũng đang phát triển chip Maia. Xu hướng các hyperscaler tập trung phát triển chip suy luận AI tự sản xuất là rõ ràng, và việc thoát khỏi sự phụ thuộc hoàn toàn vào GPU Nvidia đang trở thành định hướng chung của toàn ngành.
Tác động đến ngành
Lộ trình MTIA của Meta có khả năng tạo ra sự thay đổi cơ cấu trên thị trường chip AI vốn đang bị Nvidia thống trị. Tiếp nối Google (TPU), Amazon (Trainium/Inferentia) và Microsoft (Maia), việc Meta triển khai chiến lược chip nội bộ toàn diện được dự báo sẽ kéo giảm tỷ trọng mua sắm GPU Nvidia tại các hyperscaler trong trung và dài hạn.
Việc áp dụng RISC-V cũng là một bước ngoặt quan trọng đối với toàn ngành bán dẫn. Khi RISC-V được lựa chọn trong phân khúc chip suy luận AI — một danh mục có nhu cầu khổng lồ — hệ sinh thái của kiến trúc này có thể tăng trưởng với tốc độ vượt bậc.
Tuy nhiên, rủi ro vẫn hiện hữu. Phát triển chip nội bộ đòi hỏi đầu tư khổng lồ, và trong bối cảnh kiến trúc mô hình AI đang tiến hóa nhanh chóng, nguy cơ phần cứng trở nên lỗi thời luôn tồn tại. Liệu Meta có thực sự duy trì được lộ trình đầy tham vọng với chu kỳ 6 tháng hay không chính là chìa khóa quyết định thành bại của chiến lược này.
Tài liệu tham khảo: Thông báo từ nhóm chip AI của Meta, xu hướng từ RISC-V International, báo cáo phân tích thị trường suy luận AI, dữ liệu so sánh Google TPU và Amazon Trainium