メインコンテンツへスキップ
newsify
シリコンバレーの最前線を、確かなソースで。

SeamlessM4T

SeamlessM4T インフォグラフィック

1. サービス概要

SeamlessM4Tは、Metaが開発したマルチモーダル翻訳モデルである。音声から音声、音声からテキスト、テキストから音声、テキストからテキストの4つの翻訳タスクを単一のモデルで処理できる統合的なアーキテクチャを持つ。100以上の言語に対応しており、従来の個別タスクごとに分離されたパイプラインを不要にする設計思想で構築されている。ライセンスはCC-BY-NC 4.0で提供されており、研究・非商用利用が可能である。2023年8月に初版がリリースされ、同年12月にSeamlessM4T v2およびSeamless Expressiveなどの改良版が公開された。

2. 使用している技術スタック

  • モデルアーキテクチャ: Transformerベースのマルチモーダルモデル
  • 音声処理: w2v-BERT 2.0による音声エンコーディング
  • テキスト処理: NLLB(No Language Left Behind)の技術を継承
  • 音声合成: HiFi-GANベースのボコーダ
  • 学習データ: SeamlessAlign(自動アライメントされた大規模多言語データセット)
  • フレームワーク: PyTorch / fairseq2
  • 公開プラットフォーム: GitHub、Hugging Face
  • ライセンス: CC-BY-NC 4.0(非商用)

3. 会社概要

項目 内容
開発元 Meta Platforms, Inc.
研究部門 Meta AI(旧Facebook AI Research / FAIR)
本社所在地 米国カリフォルニア州メンロパーク
設立年 2004年(Facebook として)
CEO Mark Zuckerberg
事業内容 ソーシャルメディア、AR/VR、AI研究
従業員数 約67,000人(2024年時点)
上場市場 NASDAQ(ティッカー: META)

4. 沿革、資本構成、国籍、役員情報

沿革

  • 2013年: Facebook AI Research(FAIR)設立
  • 2022年: No Language Left Behind(NLLB)プロジェクト公開
  • 2023年8月: SeamlessM4T v1リリース、100以上の言語に対応するマルチモーダル翻訳モデルを公開
  • 2023年12月: SeamlessM4T v2、Seamless Expressive、Seamless Streamingを公開
  • 2024年: 継続的なモデル改善とコミュニティへの提供を推進

資本構成

Meta Platforms, Inc.はNASDAQ上場企業であり、公開市場で株式が取引されている。Mark Zuckerbergが議決権の過半数を保有するデュアルクラス株式構造を採用している。時価総額は約1兆ドル規模(2024年時点)。

国籍

米国(カリフォルニア州メンロパーク)

役員情報

  • Mark Zuckerberg - CEO兼会長、共同創業者
  • Yann LeCun - VP兼Chief AI Scientist、FAIR創設者
  • Joelle Pineau - VP of AI Research(FAIRの共同マネージングディレクター)