Hume AI
1. サービス概要
Hume AIは、感情理解と共感に特化した次世代の音声・マルチモーダルAIプラットフォームです。従来のテキスト読み上げ(TTS)の枠を超え、ユーザーの声のトーンから感情を読み取り、それに応じた適切な感情表現を伴う音声で応答する「Empathic Voice Interface (EVI)」を主力サービスとして展開しています。
- 主な機能:
- Empathic Voice Interface (EVI): 音声の抑揚、リズム、音色から24種類以上の感情をリアルタイムで分析し、共感的な反応を生成。
- Expression Measurement API: 動画、音声、テキストから、表情や声のトーンを通じて人間の感情を数値化・分析するAPI。
- Empathic LLM (eLLM): 感情的な文脈を理解し、満足度を最適化するように訓練された大規模言語モデル。
- ユーザー数: 具体的な累計ユーザー数は非公開。ただし、2024年3月のEVIリリース直後から開発者コミュニティで急速に普及しており、数千社以上の企業がウェイティングリストに登録。
- 対応プラットフォーム: Web API(REST, WebSocket)、SDK(TypeScript/JavaScript, Python)、Webブラウザ用デモ。
2. 使用している技術スタック
Hume AIは、感情分析と生成AIを高度に統合した独自のスタックを構築しています。
- AIモデル:
- eLLM (Empathic Large Language Model): 音声の韻律(プロソディ)とテキストを同時に処理するマルチモーダル・トランスフォーマー。
- Semantic Space Theory: カリフォルニア大学バークレー校(UC Berkeley)の研究に基づく感情空間理論を実装。
- インフラ・言語:
- バックエンド: Python, Go(リアルタイムの低遅延処理のため)。
- フロントエンド: React, Next.js, Tailwind CSS。
- インフラ: AWS (Amazon Web Services) または Google Cloud Platform (GCP) 上でのGPUクラスター運用。
- 通信プロトコル: 低遅延な双方向音声対話を実現するため、WebSocketおよびWebRTCを活用。
3. 会社概要
- 運営会社名: Hume AI, Inc.
- 設立年: 2021年
- 本社所在地: アメリカ合衆国 ニューヨーク州 ニューヨーク(520 Broadway, 9th Floor, New York, NY 10012)
- 従業員数: 約30名〜50名(2024年時点の推定)
4. 沿革、資本構成、国籍、役員情報
- 沿革:
- 2021年:GoogleのAI研究者であったAlan Cowen博士によって設立。
- 2021年-2023年:世界最大規模の感情表現データセットを構築し、感情分析APIを開発。
- 2024年3月:シリーズBで5,000万ドルの資金調達を実施し、世界初の共感型音声インターフェース「EVI」を発表。
- 資本構成: * 主要投資家: EQT Ventures(リード投資家)、Union Square Ventures、Nat Friedman(元GitHub CEO)、Daniel Gross、Metaplanet、Northwell Holdings、Comcast Ventures、LG Technology Ventures。
- 国籍: アメリカ合衆国
- 役員情報:
- Alan Cowen (Founder & CEO): * キャリア: カリフォルニア大学バークレー校で博士号取得。元Googleのシニアリサーチサイエンティスト。感情科学とセマンティック・スペース理論の権威。
- 国籍: アメリカ合衆国
- Erik Gartzke (Founding Engineer / Head of Infrastructure):
- キャリア: 分散システムとAIインフラ構築の専門家。
- 国籍: アメリカ合衆国
- Lei Xu (VP of Engineering):
- キャリア: 複数のテック企業でスケーラブルなエンジニアリングチームを率いた経験を持つ。
- 国籍: 不明(米国拠点)
