NLLB
1. サービス概要
NLLB(No Language Left Behind)は、Metaが開発したオープンソースの機械翻訳モデルである。200言語に対応した大規模多言語翻訳モデルであり、特に低リソース言語(学習データが少ない言語)の翻訳品質向上を主目的としている。従来の機械翻訳システムでは対応が困難であった少数言語やアフリカ・東南アジアの言語を含む幅広い言語ペアをカバーする。研究志向のプロジェクトとして位置付けられ、モデルの重み、学習データ、評価ベンチマークがオープンソースで公開されている。
2. 使用している技術スタック
- モデルアーキテクチャ: Transformerベースのエンコーダ・デコーダモデル(Mixture of Experts含む)
- モデルサイズ: 600M、1.3B、3.3B、54Bパラメータの複数バリエーション
- 学習データ: NLLB-Seed、Stopes(自動マイニングツール)で構築した多言語コーパス
- トークナイザ: SentencePiece
- フレームワーク: PyTorch / fairseq
- 評価: FLORES-200ベンチマーク(200言語対応の翻訳評価データセット)
- 公開プラットフォーム: GitHub、Hugging Face
- ライセンス: CC-BY-NC 4.0(研究向け)
3. 会社概要
| 項目 | 内容 |
|---|---|
| 開発元 | Meta Platforms, Inc. |
| 研究部門 | Meta AI(旧Facebook AI Research / FAIR) |
| 本社所在地 | 米国カリフォルニア州メンロパーク |
| 設立年 | 2004年(Facebook として) |
| CEO | Mark Zuckerberg |
| 事業内容 | ソーシャルメディア、AR/VR、AI研究 |
| 従業員数 | 約67,000人(2024年時点) |
| 上場市場 | NASDAQ(ティッカー: META) |
4. 沿革、資本構成、国籍、役員情報
沿革
- 2020年: No Language Left Behindプロジェクト開始、低リソース言語への翻訳品質向上を目指す
- 2022年7月: NLLBモデルおよびFLORES-200ベンチマークを公開、200言語に対応
- 2022年: NLLB-200モデル(600M、1.3B、3.3Bパラメータ版)をオープンソースで提供
- 2023年: SeamlessM4TにNLLBの技術を統合、マルチモーダル翻訳への発展
資本構成
Meta Platforms, Inc.はNASDAQ上場企業であり、公開市場で株式が取引されている。Mark Zuckerbergが議決権の過半数を保有するデュアルクラス株式構造を採用している。
国籍
米国(カリフォルニア州メンロパーク)
役員情報
- Mark Zuckerberg - CEO兼会長、共同創業者
- Yann LeCun - VP兼Chief AI Scientist、FAIR創設者
- Angela Fan - NLLBプロジェクトの主要研究者
