Helsinki-NLP
1. サービス概要
Helsinki-NLPは、フィンランドのヘルシンキ大学に所属する自然言語処理(NLP)研究グループである。OPUS-MTプロジェクトとして、1,000以上の言語ペアに対応した機械翻訳モデルをHugging Faceで公開している。研究機関であり営利企業ではないが、オープンソースの機械翻訳コミュニティにおいて最大規模のモデル提供者の一つである。OPUSコーパス(オープンな並列テキストデータベース)を基盤とした研究成果を広く公開しており、多くの翻訳アプリケーションのバックエンドとして利用されている。
2. 使用している技術スタック
- 翻訳フレームワーク: Marian NMT
- モデルアーキテクチャ: Transformerベースのエンコーダ・デコーダモデル
- 学習データ: OPUSコーパス(オープンな並列テキストデータベース)
- モデル公開: Hugging Face Hub(Helsinki-NLPオーガニゼーション)
- 推論: CTranslate2、Hugging Face Transformers
- 対応言語ペア数: 1,000以上
- トークナイザ: SentencePiece
- ライセンス: Apache 2.0(多くのモデル)/ CC-BY 4.0
- 公開プラットフォーム: Hugging Face、GitHub
3. 会社概要
| 項目 | 内容 |
|---|---|
| 組織名 | University of Helsinki, Department of Digital Humanities / NLP Group |
| 所在地 | フィンランド、ヘルシンキ |
| 組織形態 | 大学研究グループ(営利企業ではない) |
| 主要研究者 | Jörg Tiedemann |
| 事業内容 | 自然言語処理・機械翻訳の研究 |
| 主要プロジェクト | OPUS-MT、OPUSコーパス、Tatoeba Challenge |
4. 沿革、資本構成、国籍、役員情報
沿革
- 2000年代: Jörg Tiedemannを中心にOPUSコーパスプロジェクトを開始
- 2019年: OPUS-MTプロジェクトとして、Marian NMTベースの翻訳モデルを大規模に公開
- 2020年: Hugging Face上でHelsinki-NLPオーガニゼーションとして1,000以上のモデルを公開
- 2021年: Mozillaのfirefox Translationsプロジェクトに技術提供
- 2022年-2024年: モデルの継続的な改善と新しい言語ペアの追加
資本構成
ヘルシンキ大学は公立大学であり、フィンランド政府からの公的資金、EU研究助成金(Horizon Europeなど)、およびその他の研究助成により運営されている。営利企業としての資本構成は存在しない。
国籍
フィンランド(ヘルシンキ)
役員情報
- Jörg Tiedemann - ヘルシンキ大学教授、NLPグループ主任研究者。OPUSコーパスおよびOPUS-MTプロジェクトの創設者。言語技術分野の研究を長年にわたり主導している。
