Deepgram
1. サービス概要
Deepgramは、エンタープライズ向けの「Voice AI(音声AI)」プラットフォームを提供しています。元々は高精度な音声認識(STT: Speech-to-Text)で知られていましたが、現在はTTS(Text-to-Speech:音声合成)、およびそれらを統合した音声対話(Speech-to-Speech)ソリューションに注力しています。
- TTS分野での役割: リアルタイムの音声対話に特化した、超低遅延(Latency)かつ自然な音声合成エンジン「Aura」を提供。
- 主な機能: * Auraモデル: 人間のような自然なイントネーションを持つ音声合成。
- リアルタイムストリーミング: 数百ミリ秒単位の極めて低いレイテンシでの音声生成。
- マルチリンガル対応: 英語を中心に多言語での音声出力をサポート。
- API/SDK連携: 開発者が既存のアプリケーション(AIエージェント、コールセンター等)に容易に組み込めるAPI。
- ユーザー数: 200,000人以上の開発者が利用(2025年時点)。
- 対応プラットフォーム: Web API(REST, WebSocket)、AWS(SageMaker等)、Python/JavaScript/Go/.NET等の主要言語向けSDK、およびセルフホスト(オンプレミス)環境。
2. 使用している技術スタック
Deepgramは「End-to-End Deep Learning」を標榜しており、独自の深層学習モデルを基盤としています。
- AI/ML基盤: 独自の基盤モデル(Novaシリーズ、Auraシリーズ)。
- プログラミング言語: Python(モデル開発・リサーチ)、Go、Rust(高パフォーマンスな推論エンジン・バックエンド)、JavaScript/TypeScript(SDK・フロントエンド)。
- インフラ: AWS(Amazon Web Services)、GCP、NVIDIA GPU(推論加速)、Docker、Kubernetes。
- その他: WebSockets(ストリーミング通信)、gRPC。
3. 会社概要
- 運営会社名: Deepgram, Inc.
- 設立年: 2015年
- 本社所在地: 548 Market Street, Suite 25104, San Francisco, CA 94104, USA
- 従業員数: 約150名〜180名(2026年初頭時点の各社データより推定)
4. 沿革、資本構成、国籍、役員情報
- 沿革: * 2015年、素粒子物理学の研究者らによって設立。
- Y Combinator(W16)に参加し、音声データの検索技術からスタート。
- 2022年、シリーズBで3,000万ドルを調達。
- 2026年1月、シリーズCで1億3,000万ドル(評価額13億ドル)を調達。
- 資本構成: 非公開(プライベート企業)。主な出資者は、AVP(リード投資家)、Madrona Venture Group、NVIDIA Corporation、Tiger Global Management、Alkeon Capital、In-Q-Tel、Wing VC、Y Combinator、SAP、ServiceNow Venturesなど。
- 国籍: アメリカ合衆国
- 役員情報:
- Scott Stephenson (CEO & Co-founder): アメリカ国籍。ミシガン大学で素粒子物理学の博士号を取得。ダークマター検出の研究からディープラーニングの世界へ転身。
- Adam Sypniewski (Founder): アメリカ国籍。ミシガン大学で物理学博士号取得。元CTO(現在は技術顧問等の役割)。
- Mark Hester (CTO): 技術部門を統括。
- Ivan Lee (CPO): 製品部門を統括。
- Lance Cummins (CFO): 財務部門を統括。
