Neuphonic
1. サービス概要
Neuphonicは、超低遅延(Ultra-Low Latency)を特徴とする次世代のAIテキスト読み上げ(TTS:Text-to-Speech)サービスです。独自のアルゴリズムにより、文章が完成するのを待たずに単語単位でリアルタイムに音声を生成する「インクリメンタル(逐次)生成」を実現しています。
- 主な機能:
- 超低遅延音声合成: 25ミリ秒以下のレイテンシで音声を生成。
- ボイスクローニング: わずか数秒(3〜6秒)の音声サンプルから、特定の人物の声を再現。
- オンデバイス実行: GPUを必要とせず、ノートPC、スマートフォン、組み込み機器などのローカル環境で動作する軽量モデルを提供。
- 多言語対応: 複数の言語や方言、感情豊かな音声ライブラリを提供。
- API/SDK提供: 開発者が自社製品(カスタマーサポート、ロボティクス、ゲーム等)に容易に組み込めるインターフェース。
- ユーザー数: 10,000人以上(公式サイトおよび関連情報による)。
- 対応プラットフォーム: Web API、Windows、macOS、Linux、iOS、Android、および各種組み込みシステム(オンデバイス展開に対応)。
2. 使用している技術スタック
公開されている情報およびエンジニアリングの特性から判明している技術要素は以下の通りです。
- 音声合成アルゴリズム: 特許出願中の独自のインクリメンタル生成アルゴリズム(文章の終わりを待たずに逐次処理を行う手法)。
- モデル構成: 「NeuTTS Air」などの軽量な音声言語モデル(Speech Language Models)。大規模言語モデル(LLM)と直接連携可能なアーキテクチャ。
- インフラ・デプロイ:
- クラウド: Google Cloud(Google Cloud Marketplaceでの提供あり)。
- ローカル: 量子化技術等を用いたオンデバイス推論エンジン。
- 開発言語・ツール: Python(AIモデル開発)、Hugging Face(モデル公開用)、REST API / WebSocket(ストリーミング通信用)。
3. 会社概要
- 運営会社名: Neuphonic Ltd.
- 設立年: 2024年
- 本社所在地: イギリス、ロンドン(London, United Kingdom)
- 従業員数: 約7名(2026年1月時点の推定データ)
4. 沿革、資本構成、国籍、役員情報
- 沿革:
- 2024年: ロンドンにて設立。
- 2024年10月: シードラウンドにて350万ユーロ(約391万ドル)の資金調達を実施。
- 2024年末〜2025年: 「NeuTTS Air」がHugging Faceでトレンド入りするなど、オンデバイスAI分野で注目を集める。
- 資本構成:
- リード投資家: Moonfire Ventures(ムーンファイア・ベンチャーズ)。
- その他投資家: Tiny.vc、Salica Investments、および複数のエンジェル投資家(ケンブリッジ大学のSteve Young教授など)。
- 国籍: イギリス
- 役員情報(創業者・主要メンバー):
- Jiameng Gao (CEO & Co-founder): 中国出身、ケンブリッジ大学で音声処理(Speech Processing)の博士号を取得。過去に音声認識や音声合成の研究に従事。
- Sohaib Ahmad (Co-founder): 共同創設者。ビジネス開発や製品戦略を担当。
- Steve Young (Advisor/Investor): ケンブリッジ大学教授であり、音声認識技術の世界的権威(元AppleのSiriチームメンバー)。アドバイザーおよび投資家として参画。
