メインコンテンツへスキップ
newsify
シリコンバレーの最前線を、確かなソースで。
OpenNMT インフォグラフィック

1. サービス概要

OpenNMTは、オープンソースのニューラル機械翻訳(NMT)フレームワークである。Harvard NLPグループとSYSTRAN(フランスの機械翻訳企業)の共同プロジェクトとして2016年に開始された。PyTorch版(OpenNMT-py)とTensorFlow版(OpenNMT-tf)の2つの実装が提供されている。MITライセンスで公開されており、多くの機械翻訳システムの基盤として使用されている。Argos Translate、LibreTranslateなど多数のオープンソース翻訳プロジェクトがOpenNMTの技術を活用している。

2. 使用している技術スタック

  • フレームワーク: OpenNMT-py(PyTorch版)、OpenNMT-tf(TensorFlow版)
  • 推論エンジン: CTranslate2(C++実装の高速推論エンジン)
  • モデルアーキテクチャ: Transformer、RNN(LSTM/GRU)、CNN対応
  • トークナイザ: SentencePiece、BPE、WordPiece対応
  • 学習機能: マルチGPU訓練、混合精度訓練、チェックポイント管理
  • サーバー機能: REST API サーバー機能内蔵
  • プログラミング言語: Python(コア)、C++(CTranslate2)
  • ライセンス: MIT License
  • 公開プラットフォーム: GitHub

3. 会社概要

項目 内容
開発元 Harvard NLP Group / SYSTRAN
プロジェクト形態 オープンソースプロジェクト(学術・企業共同)
SYSTRAN本社 フランス、パリ
SYSTRAN設立年 1968年
主要研究者 Guillaume Klein(SYSTRAN)、Alexander Rush(Harvard NLP)
ライセンス MIT License
GitHubスター数 OpenNMT-py: 6,500+(2024年時点)

4. 沿革、資本構成、国籍、役員情報

沿革

  • 1968年: SYSTRAN設立(世界初の商用機械翻訳企業の一つ)
  • 2016年12月: Harvard NLPグループとSYSTRANの共同でOpenNMTプロジェクトを開始
  • 2017年: OpenNMT-py(PyTorch版)およびOpenNMT-tf(TensorFlow版)を公開
  • 2018年: CTranslate(高速推論エンジン)を開発
  • 2019年: CTranslate2をリリース、推論速度を大幅に向上
  • 2020年-2024年: 継続的な改善、Transformerモデルの最適化、コミュニティ成長

資本構成

OpenNMTはオープンソースプロジェクトであり、Harvard大学とSYSTRANの共同によって維持されている。SYSTRANは韓国のCSLi(Chungso Leports Industry)グループ傘下の企業であり、2014年に韓国企業に買収された。

国籍

  • Harvard NLP: 米国(マサチューセッツ州ケンブリッジ)
  • SYSTRAN: フランス(パリ)、韓国資本

役員情報

  • Alexander Rush - Harvard NLP主任研究者(後にCornell大学に移籍)。OpenNMTプロジェクトの学術側リーダー
  • Guillaume Klein - SYSTRAN所属の研究者、OpenNMT-pyおよびCTranslate2の主要開発者
  • Jean Senellart - SYSTRAN CEO、機械翻訳分野の長年の専門家