OpenNMT
公式サイト1. サービス概要
OpenNMTは、オープンソースのニューラル機械翻訳(NMT)フレームワークである。Harvard NLPグループとSYSTRAN(フランスの機械翻訳企業)の共同プロジェクトとして2016年に開始された。PyTorch版(OpenNMT-py)とTensorFlow版(OpenNMT-tf)の2つの実装が提供されている。MITライセンスで公開されており、多くの機械翻訳システムの基盤として使用されている。Argos Translate、LibreTranslateなど多数のオープンソース翻訳プロジェクトがOpenNMTの技術を活用している。
2. 使用している技術スタック
- フレームワーク: OpenNMT-py(PyTorch版)、OpenNMT-tf(TensorFlow版)
- 推論エンジン: CTranslate2(C++実装の高速推論エンジン)
- モデルアーキテクチャ: Transformer、RNN(LSTM/GRU)、CNN対応
- トークナイザ: SentencePiece、BPE、WordPiece対応
- 学習機能: マルチGPU訓練、混合精度訓練、チェックポイント管理
- サーバー機能: REST API サーバー機能内蔵
- プログラミング言語: Python(コア)、C++(CTranslate2)
- ライセンス: MIT License
- 公開プラットフォーム: GitHub
3. 会社概要
| 項目 | 内容 |
|---|---|
| 開発元 | Harvard NLP Group / SYSTRAN |
| プロジェクト形態 | オープンソースプロジェクト(学術・企業共同) |
| SYSTRAN本社 | フランス、パリ |
| SYSTRAN設立年 | 1968年 |
| 主要研究者 | Guillaume Klein(SYSTRAN)、Alexander Rush(Harvard NLP) |
| ライセンス | MIT License |
| GitHubスター数 | OpenNMT-py: 6,500+(2024年時点) |
4. 沿革、資本構成、国籍、役員情報
沿革
- 1968年: SYSTRAN設立(世界初の商用機械翻訳企業の一つ)
- 2016年12月: Harvard NLPグループとSYSTRANの共同でOpenNMTプロジェクトを開始
- 2017年: OpenNMT-py(PyTorch版)およびOpenNMT-tf(TensorFlow版)を公開
- 2018年: CTranslate(高速推論エンジン)を開発
- 2019年: CTranslate2をリリース、推論速度を大幅に向上
- 2020年-2024年: 継続的な改善、Transformerモデルの最適化、コミュニティ成長
資本構成
OpenNMTはオープンソースプロジェクトであり、Harvard大学とSYSTRANの共同によって維持されている。SYSTRANは韓国のCSLi(Chungso Leports Industry)グループ傘下の企業であり、2014年に韓国企業に買収された。
国籍
- Harvard NLP: 米国(マサチューセッツ州ケンブリッジ)
- SYSTRAN: フランス(パリ)、韓国資本
役員情報
- Alexander Rush - Harvard NLP主任研究者(後にCornell大学に移籍)。OpenNMTプロジェクトの学術側リーダー
- Guillaume Klein - SYSTRAN所属の研究者、OpenNMT-pyおよびCTranslate2の主要開発者
- Jean Senellart - SYSTRAN CEO、機械翻訳分野の長年の専門家
