newsify

ElevenLabs

1. サービス概要

ElevenLabsは、人工知能(AI)を活用した音声生成およびテキスト読み上げ(TTS: Text-to-Speech)サービスを提供するAIオーディオ研究企業です。

  • 主な機能:
  • Text to Speech: 29以上の言語に対応し、感情豊かで人間のような自然な音声を生成。
  • Voice Cloning: 数分の音声サンプルから特定の個人の声を高精度に複製。
  • AI Dubbing: 動画の音声を元の話者の声質を維持したまま他言語へ吹き替え。
  • Speech to Speech: ある人の話し方を別の声に変換(アクセントや抑揚を保持)。
  • ElevenAgents: 対話型AIエージェントの構築プラットフォーム。
  • Audio Native: ニュース記事などのウェブコンテンツを自動で音声化するプレイヤー。
  • ユーザー数: 100万人以上の登録ユーザー(2025年1月時点の公開情報に基づく)。
  • 対応プラットフォーム:
  • Webブラウザ(公式ダッシュボード)
  • API(開発者向け)
  • iOS/Android アプリ(リーダーアプリ等)
  • 各種インテグレーション(Canva、WordPress等)

2. 使用している技術スタック

ElevenLabsは独自のディープラーニングモデルを開発しており、詳細は企業秘密の部分が多いものの、以下の構成が判明・推測されています。

  • コア技術: Transformerアーキテクチャベースの独自音声合成モデル(生成AI)。従来の連結合成法や単純なニューラルTTSとは異なり、文脈と感情を理解する「Generative Voice AI」を採用。
  • 言語/フレームワーク: Python(AIモデル開発)、React(フロントエンド)、TypeScript。
  • インフラ: クラウドベースの分散GPUクラスタ(スケーラブルな推論環境)。
  • 研究開発: 低レイテンシのリアルタイム音声ストリーミング技術、数秒のデータで学習可能な独自のファインチューニング・アルゴリズム。

3. 会社概要

  • 運営会社名: ElevenLabs Inc.
  • 設立年: 2022年
  • 本社所在地: 米国 ニューヨーク州 ニューヨーク(169 Madison Ave, New York, NY 10016)
    ※ロンドンやワルシャワにも主要な拠点を置く。
  • 従業員数: 約190名〜200名(2025年初頭時点)。

4. 沿革、資本構成、国籍、役員情報

  • 沿革:
  • 2022年:ポーランド出身の幼馴染2人により設立。
  • 2023年1月:ベータ版公開。200万ドルのプレシード調達。
  • 2023年6月:シリーズAで1,900万ドル調達。
  • 2024年1月:シリーズBで8,000万ドル調達し、評価額11億ドルの「ユニコーン」となる。
  • 2025年1月:シリーズCで1.8億ドル調達、評価額33億ドル。
  • 2026年2月:シリーズDで5億ドル調達、評価額110億ドルに到達。
  • 資本構成:
  • 非上場。Andreessen Horowitz (a16z)、Sequoia Capital、ICONIQ Growth、Nat Friedman、Daniel Gross、NVentures (NVIDIA)、Salesforce Ventures 等の有力VCおよび個人投資家が出資。
  • 国籍:
  • 米国企業(デラウェア州法人)。ただし、創業背景や開発拠点の経緯から「ポーランド系/英国系AIスタートアップ」と称されることが多い。
  • 役員情報:
  • Mati Staniszewski (CEO / 共同創業者): ポーランド出身。インペリアル・カレッジ・ロンドン卒。元Palantirの展開戦略担当。
  • Piotr Dąbkowski (CTO / 共同創業者): ポーランド出身。オックスフォード大学・ケンブリッジ大学卒。元Googleの機械学習エンジニア。
  • Andrew Reed: 取締役。Sequoia Capitalのパートナー(2026年の出資に伴い参画)。