摘要
Meta公布了自研AI芯片"MTIA"系列的四代路线图。四款芯片分别为MTIA 300(量产中)、400"Iris"(实验室测试阶段)、450"Arke"、500"Astrid",计划每约6个月发布一款。该系列以RISC-V架构为基础,与博通(Broadcom)和台积电(TSMC)合作开发,专为生成式AI推理设计,旨在摆脱对英伟达GPU的依赖。不过,训练场景仍将继续使用英伟达Blackwell,因此这一战略定位为"多元化"而非"替代"。
正文
Meta于2026年3月19日发布了自主研发的AI推理芯片"MTIA"(Meta Training and Inference Accelerator)的全面路线图。计划以约6个月的发布周期,依次推出MTIA 300、400"Iris"、450"Arke"、500"Astrid"四代产品。各代均被赋予代号,这表明Meta将该芯片系列定位为长期业务基础,而非一时的实验性产品。
MTIA 300——进入量产阶段的第一代
首款型号MTIA 300已进入量产阶段,并在Meta内部数据中心投入实际运行。它处理Facebook、Instagram、WhatsApp等主力服务的生成式AI推理工作负载,Meta声称其每瓦性能超越了Nvidia GPU。对于需要向数十亿用户提供AI服务的Meta而言,优化推理成本是直接影响基础设施支出的首要课题。
MTIA 400"Iris"——首款可与商用产品竞争的自研芯片
目前处于实验室测试阶段的MTIA 400"Iris",将成为Meta的重要里程碑。该公司将这款芯片定位为"首款在原始性能(raw performance)上可与市场领先商用产品相抗衡的芯片"。也就是说,MTIA 300以"针对自身工作负载优化的成本效益"为优势,而Iris则旨在绝对性能上也达到可与Nvidia GPU媲美的水准。
MTIA 450"Arke"——带宽翻倍
MTIA 450"Arke"的HBM(高带宽内存)带宽相比MTIA 400翻倍。Meta将这一带宽描述为"远超现有市场领先产品(much higher than existing leading commercial products)",旨在从根本上解决大型语言模型推理中内存带宽成为瓶颈的问题。生成式AI推理需要高速地从内存加载模型权重数据,带宽的扩大直接带来推理速度的提升。
MTIA 500"Astrid"——路线图的集大成之作
路线图最终代MTIA 500"Astrid"的详细信息目前仍有限,但据称将在Arke确立的高带宽架构基础上进一步演进。若Meta能维持每6个月一代的发布周期,Astrid将于2027年下半年至2028年初登场。
技术基础——RISC-V、Broadcom、台积电
在技术层面,MTIA系列采用RISC-V架构。RISC-V是开源指令集架构(ISA),无需授权费且定制性强,能够实现不受基于Arm的芯片或Nvidia CUDA生态系统束缚的独立设计。芯片制造由台积电负责,在设计方面与Broadcom建立了深度合作关系。每6个月发布新一代的积极周期,比Nvidia的年度发布周期更快。
推理专用的战略意义——"多元化"而非"替代"
重要的是,MTIA专注于推理(Inference)而非训练(Training)。AI模型的训练仍然使用Nvidia的Blackwell系列GPU,Meta今后将继续从Nvidia和AMD采购GPU。MTIA并非"取代Nvidia",而是"多元化(diversification)"战略,通过将部分推理工作负载迁移至自研芯片,同时实现降低供应商依赖风险与优化成本的双重目标。
这种"多元化"方式并非Meta独有。谷歌通过TPU(张量处理器)覆盖训练与推理,亚马逊则以Trainium承担训练、Inferentia承担推理,实现芯片自研化。微软也正在开发Maia芯片。超大规模云服务商纷纷致力于开发自研AI推理芯片的趋势已十分明确,摆脱对Nvidia GPU的单一依赖正成为整个行业的方向。
对行业的影响
Meta的MTIA路线图有可能为英伟达主导的AI半导体市场带来结构性变化。继谷歌(TPU)、亚马逊(Trainium/Inferentia)、微软(Maia)之后,Meta全面推进自研芯片战略,预计超大规模云服务商对英伟达GPU的采购比例将在中长期内有所下降。
RISC-V的采用对整个半导体行业而言也是一个重要转折点。在AI推理芯片这一大规模需求品类中引入RISC-V,有可能加速该架构生态系统的成长。
不过风险同样存在。自研芯片开发需要巨额投资,在AI模型架构快速演进的背景下,硬件面临过时淘汰的风险始终存在。Meta能否真正维持6个月为周期的雄心勃勃的路线图,将是这一战略成败的关键所在。
参考信息:Meta AI半导体团队发布,RISC-V International动向,AI推理市场分析报告,谷歌TPU・亚马逊Trainium对比数据