ElevenLabs
1. サービス概要
ElevenLabsは、人工知能(AI)を活用した音声生成およびテキスト読み上げ(TTS: Text-to-Speech)サービスを提供するAIオーディオ研究企業です。
- 主な機能:
- Text to Speech: 29以上の言語に対応し、感情豊かで人間のような自然な音声を生成。
- Voice Cloning: 数分の音声サンプルから特定の個人の声を高精度に複製。
- AI Dubbing: 動画の音声を元の話者の声質を維持したまま他言語へ吹き替え。
- Speech to Speech: ある人の話し方を別の声に変換(アクセントや抑揚を保持)。
- ElevenAgents: 対話型AIエージェントの構築プラットフォーム。
- Audio Native: ニュース記事などのウェブコンテンツを自動で音声化するプレイヤー。
- ユーザー数: 100万人以上の登録ユーザー(2025年1月時点の公開情報に基づく)。
- 対応プラットフォーム:
- Webブラウザ(公式ダッシュボード)
- API(開発者向け)
- iOS/Android アプリ(リーダーアプリ等)
- 各種インテグレーション(Canva、WordPress等)
2. 使用している技術スタック
ElevenLabsは独自のディープラーニングモデルを開発しており、詳細は企業秘密の部分が多いものの、以下の構成が判明・推測されています。
- コア技術: Transformerアーキテクチャベースの独自音声合成モデル(生成AI)。従来の連結合成法や単純なニューラルTTSとは異なり、文脈と感情を理解する「Generative Voice AI」を採用。
- 言語/フレームワーク: Python(AIモデル開発)、React(フロントエンド)、TypeScript。
- インフラ: クラウドベースの分散GPUクラスタ(スケーラブルな推論環境)。
- 研究開発: 低レイテンシのリアルタイム音声ストリーミング技術、数秒のデータで学習可能な独自のファインチューニング・アルゴリズム。
3. 会社概要
- 運営会社名: ElevenLabs Inc.
- 設立年: 2022年
- 本社所在地: 米国 ニューヨーク州 ニューヨーク(169 Madison Ave, New York, NY 10016)
※ロンドンやワルシャワにも主要な拠点を置く。 - 従業員数: 約190名〜200名(2025年初頭時点)。
4. 沿革、資本構成、国籍、役員情報
- 沿革:
- 2022年:ポーランド出身の幼馴染2人により設立。
- 2023年1月:ベータ版公開。200万ドルのプレシード調達。
- 2023年6月:シリーズAで1,900万ドル調達。
- 2024年1月:シリーズBで8,000万ドル調達し、評価額11億ドルの「ユニコーン」となる。
- 2025年1月:シリーズCで1.8億ドル調達、評価額33億ドル。
- 2026年2月:シリーズDで5億ドル調達、評価額110億ドルに到達。
- 資本構成:
- 非上場。Andreessen Horowitz (a16z)、Sequoia Capital、ICONIQ Growth、Nat Friedman、Daniel Gross、NVentures (NVIDIA)、Salesforce Ventures 等の有力VCおよび個人投資家が出資。
- 国籍:
- 米国企業(デラウェア州法人)。ただし、創業背景や開発拠点の経緯から「ポーランド系/英国系AIスタートアップ」と称されることが多い。
- 役員情報:
- Mati Staniszewski (CEO / 共同創業者): ポーランド出身。インペリアル・カレッジ・ロンドン卒。元Palantirの展開戦略担当。
- Piotr Dąbkowski (CTO / 共同創業者): ポーランド出身。オックスフォード大学・ケンブリッジ大学卒。元Googleの機械学習エンジニア。
- Andrew Reed: 取締役。Sequoia Capitalのパートナー(2026年の出資に伴い参画)。
