newsify

Deepgram

1. サービス概要

Deepgramは、エンタープライズ向けの「Voice AI(音声AI)」プラットフォームを提供しています。元々は高精度な音声認識(STT: Speech-to-Text)で知られていましたが、現在はTTS(Text-to-Speech:音声合成)、およびそれらを統合した音声対話(Speech-to-Speech)ソリューションに注力しています。

  • TTS分野での役割: リアルタイムの音声対話に特化した、超低遅延(Latency)かつ自然な音声合成エンジン「Aura」を提供。
  • 主な機能: * Auraモデル: 人間のような自然なイントネーションを持つ音声合成。
  • リアルタイムストリーミング: 数百ミリ秒単位の極めて低いレイテンシでの音声生成。
  • マルチリンガル対応: 英語を中心に多言語での音声出力をサポート。
  • API/SDK連携: 開発者が既存のアプリケーション(AIエージェント、コールセンター等)に容易に組み込めるAPI。
  • ユーザー数: 200,000人以上の開発者が利用(2025年時点)。
  • 対応プラットフォーム: Web API(REST, WebSocket)、AWS(SageMaker等)、Python/JavaScript/Go/.NET等の主要言語向けSDK、およびセルフホスト(オンプレミス)環境。

2. 使用している技術スタック

Deepgramは「End-to-End Deep Learning」を標榜しており、独自の深層学習モデルを基盤としています。

  • AI/ML基盤: 独自の基盤モデル(Novaシリーズ、Auraシリーズ)。
  • プログラミング言語: Python(モデル開発・リサーチ)、Go、Rust(高パフォーマンスな推論エンジン・バックエンド)、JavaScript/TypeScript(SDK・フロントエンド)。
  • インフラ: AWS(Amazon Web Services)、GCP、NVIDIA GPU(推論加速)、Docker、Kubernetes。
  • その他: WebSockets(ストリーミング通信)、gRPC。

3. 会社概要

  • 運営会社名: Deepgram, Inc.
  • 設立年: 2015年
  • 本社所在地: 548 Market Street, Suite 25104, San Francisco, CA 94104, USA
  • 従業員数: 約150名〜180名(2026年初頭時点の各社データより推定)

4. 沿革、資本構成、国籍、役員情報

  • 沿革: * 2015年、素粒子物理学の研究者らによって設立。
  • Y Combinator(W16)に参加し、音声データの検索技術からスタート。
  • 2022年、シリーズBで3,000万ドルを調達。
  • 2026年1月、シリーズCで1億3,000万ドル(評価額13億ドル)を調達。
  • 資本構成: 非公開(プライベート企業)。主な出資者は、AVP(リード投資家)、Madrona Venture Group、NVIDIA Corporation、Tiger Global Management、Alkeon Capital、In-Q-Tel、Wing VC、Y Combinator、SAP、ServiceNow Venturesなど。
  • 国籍: アメリカ合衆国
  • 役員情報:
  • Scott Stephenson (CEO & Co-founder): アメリカ国籍。ミシガン大学で素粒子物理学の博士号を取得。ダークマター検出の研究からディープラーニングの世界へ転身。
  • Adam Sypniewski (Founder): アメリカ国籍。ミシガン大学で物理学博士号取得。元CTO(現在は技術顧問等の役割)。
  • Mark Hester (CTO): 技術部門を統括。
  • Ivan Lee (CPO): 製品部門を統括。
  • Lance Cummins (CFO): 財務部門を統括。