newsify

Hume AI

1. サービス概要

Hume AIは、感情理解と共感に特化した次世代の音声・マルチモーダルAIプラットフォームです。従来のテキスト読み上げ(TTS)の枠を超え、ユーザーの声のトーンから感情を読み取り、それに応じた適切な感情表現を伴う音声で応答する「Empathic Voice Interface (EVI)」を主力サービスとして展開しています。

  • 主な機能:
  • Empathic Voice Interface (EVI): 音声の抑揚、リズム、音色から24種類以上の感情をリアルタイムで分析し、共感的な反応を生成。
  • Expression Measurement API: 動画、音声、テキストから、表情や声のトーンを通じて人間の感情を数値化・分析するAPI。
  • Empathic LLM (eLLM): 感情的な文脈を理解し、満足度を最適化するように訓練された大規模言語モデル。
  • ユーザー数: 具体的な累計ユーザー数は非公開。ただし、2024年3月のEVIリリース直後から開発者コミュニティで急速に普及しており、数千社以上の企業がウェイティングリストに登録。
  • 対応プラットフォーム: Web API(REST, WebSocket)、SDK(TypeScript/JavaScript, Python)、Webブラウザ用デモ。

2. 使用している技術スタック

Hume AIは、感情分析と生成AIを高度に統合した独自のスタックを構築しています。

  • AIモデル:
  • eLLM (Empathic Large Language Model): 音声の韻律(プロソディ)とテキストを同時に処理するマルチモーダル・トランスフォーマー。
  • Semantic Space Theory: カリフォルニア大学バークレー校(UC Berkeley)の研究に基づく感情空間理論を実装。
  • インフラ・言語:
  • バックエンド: Python, Go(リアルタイムの低遅延処理のため)。
  • フロントエンド: React, Next.js, Tailwind CSS。
  • インフラ: AWS (Amazon Web Services) または Google Cloud Platform (GCP) 上でのGPUクラスター運用。
  • 通信プロトコル: 低遅延な双方向音声対話を実現するため、WebSocketおよびWebRTCを活用。

3. 会社概要

  • 運営会社名: Hume AI, Inc.
  • 設立年: 2021年
  • 本社所在地: アメリカ合衆国 ニューヨーク州 ニューヨーク(520 Broadway, 9th Floor, New York, NY 10012)
  • 従業員数: 約30名〜50名(2024年時点の推定)

4. 沿革、資本構成、国籍、役員情報

  • 沿革:
  • 2021年:GoogleのAI研究者であったAlan Cowen博士によって設立。
  • 2021年-2023年:世界最大規模の感情表現データセットを構築し、感情分析APIを開発。
  • 2024年3月:シリーズBで5,000万ドルの資金調達を実施し、世界初の共感型音声インターフェース「EVI」を発表。
  • 資本構成: * 主要投資家: EQT Ventures(リード投資家)、Union Square Ventures、Nat Friedman(元GitHub CEO)、Daniel Gross、Metaplanet、Northwell Holdings、Comcast Ventures、LG Technology Ventures。
  • 国籍: アメリカ合衆国
  • 役員情報:
  • Alan Cowen (Founder & CEO): * キャリア: カリフォルニア大学バークレー校で博士号取得。元Googleのシニアリサーチサイエンティスト。感情科学とセマンティック・スペース理論の権威。
    • 国籍: アメリカ合衆国
  • Erik Gartzke (Founding Engineer / Head of Infrastructure):
    • キャリア: 分散システムとAIインフラ構築の専門家。
    • 国籍: アメリカ合衆国
  • Lei Xu (VP of Engineering):
    • キャリア: 複数のテック企業でスケーラブルなエンジニアリングチームを率いた経験を持つ。
    • 国籍: 不明(米国拠点)