Deepgram

1. サービス概要

Deepgramは、エンタープライズ向けの「Voice AI（音声AI）」プラットフォームを提供しています。元々は高精度な音声認識（STT: Speech-to-Text）で知られていましたが、現在はTTS（Text-to-Speech：音声合成）、およびそれらを統合した音声対話（Speech-to-Speech）ソリューションに注力しています。

TTS分野での役割: リアルタイムの音声対話に特化した、超低遅延（Latency）かつ自然な音声合成エンジン「Aura」を提供。
主な機能: * Auraモデル: 人間のような自然なイントネーションを持つ音声合成。
リアルタイムストリーミング: 数百ミリ秒単位の極めて低いレイテンシでの音声生成。
マルチリンガル対応: 英語を中心に多言語での音声出力をサポート。
API/SDK連携: 開発者が既存のアプリケーション（AIエージェント、コールセンター等）に容易に組み込めるAPI。
ユーザー数: 200,000人以上の開発者が利用（2025年時点）。
対応プラットフォーム: Web API（REST, WebSocket）、AWS（SageMaker等）、Python/JavaScript/Go/.NET等の主要言語向けSDK、およびセルフホスト（オンプレミス）環境。

2. 使用している技術スタック

Deepgramは「End-to-End Deep Learning」を標榜しており、独自の深層学習モデルを基盤としています。

AI/ML基盤: 独自の基盤モデル（Novaシリーズ、Auraシリーズ）。
プログラミング言語: Python（モデル開発・リサーチ）、Go、Rust（高パフォーマンスな推論エンジン・バックエンド）、JavaScript/TypeScript（SDK・フロントエンド）。
インフラ: AWS（Amazon Web Services）、GCP、NVIDIA GPU（推論加速）、Docker、Kubernetes。
その他: WebSockets（ストリーミング通信）、gRPC。

3. 会社概要

運営会社名: Deepgram, Inc.
設立年: 2015年
本社所在地: 548 Market Street, Suite 25104, San Francisco, CA 94104, USA
従業員数: 約150名〜180名（2026年初頭時点の各社データより推定）

4. 沿革、資本構成、国籍、役員情報

沿革: * 2015年、素粒子物理学の研究者らによって設立。
Y Combinator（W16）に参加し、音声データの検索技術からスタート。
2022年、シリーズBで3,000万ドルを調達。
2026年1月、シリーズCで1億3,000万ドル（評価額13億ドル）を調達。
資本構成: 非公開（プライベート企業）。主な出資者は、AVP（リード投資家）、Madrona Venture Group、NVIDIA Corporation、Tiger Global Management、Alkeon Capital、In-Q-Tel、Wing VC、Y Combinator、SAP、ServiceNow Venturesなど。
国籍: アメリカ合衆国
役員情報:
Scott Stephenson (CEO & Co-founder): アメリカ国籍。ミシガン大学で素粒子物理学の博士号を取得。ダークマター検出の研究からディープラーニングの世界へ転身。
Adam Sypniewski (Founder): アメリカ国籍。ミシガン大学で物理学博士号取得。元CTO（現在は技術顧問等の役割）。
Mark Hester (CTO): 技術部門を統括。
Ivan Lee (CPO): 製品部門を統括。
Lance Cummins (CFO): 財務部門を統括。

TTS に戻る