Rime
1. サービス概要
Rime(Rime Labs)は、リアルタイムの対話型AI向けに特化した、超低遅延かつ高品位なテキスト読み上げ(TTS)サービスを提供しています。
- 主な機能:
- 超低遅延音声生成: 200ms未満(最短150ms)の「Time to First Byte(最初の音声データまでの時間)」を実現し、AIとの自然な会話を可能にします。
- 多様な音声モデル: 300種類以上の音声、感情表現豊かな「Arcana」モデルや、エンタープライズ向けの安定性に優れた「Mist」モデルを提供。
- カスタム発音調整: ブランド名や専門用語の読みを音節単位で細かく制御できる機能。
- バイリンガル・コードスイッチング: 複数の言語を混ぜた発話にもリアルタイムで対応。
- ユーザー数(利用規模): 月間数千万件以上のリアルタイム会話をサポートしており、毎日100万件以上のリクエストを処理しています(通信、金融、ヘルスケア等の企業が中心)。
- 対応プラットフォーム: クラウドAPI、オンプレミス、専用エンドポイント、LiveKit等の外部プラットフォームとのプラグイン連携。
2. 使用している技術スタック
公開されている技術情報およびエンジニアブログ等に基づく情報は以下の通りです。
- モデルアーキテクチャ: 独自のデータセットでトレーニングされたエンドツーエンドの音声合成モデル。従来のスタジオ録音ではなく、ドライブスルーやカスタマーサービス等の「現実的な会話」を学習データに使用。
- インフラ・推論: Baseten(推論インフラ)を使用し、高速かつ安全なモデルサービングを実現。
- インターフェース: WebSocket(リアルタイム対話用、単語レベルのタイミング制御が可能)およびHTTP(汎用的なユースケース用)のAPIを提供。
- その他: * 言語: Python(Pipecat SDK等での統合)
- 音声処理: システムネイティブのオーディオ再生(macOSのafplay等)を利用した軽量なサーバー構成。
3. 会社概要
- 運営会社名: Rime Labs Inc.
- 設立年: 2022年(一部資料では2020年から活動開始と記載あり)
- 本社所在地: 911 Minna Street, San Francisco, CA 94103, United States
- 従業員数: 約10名(少数精鋭の言語学者、MLエンジニア、スタートアップ経験者で構成)
4. 沿革、資本構成、国籍、役員情報
- 沿革: * 2022年: Lily Clifford氏らによってサンフランシスコで設立。独自の会話音声データセットの収集を開始。
- 2023年: シードラウンドでの資金調達を実施。
- 2025年5月: Unusual Venturesをリード投資家として、550万ドルのシード資金調達を公表。
- 資本構成: 非公開(VCおよびエンジェル投資家による出資)。主な投資家は Unusual Ventures, Cadenza Capital, Founders You Should Know, Plug and Play Tech Center 等。累計調達額は約860万ドル〜960万ドルと推定。
- 国籍: アメリカ合衆国。
- 役員情報:
- Lily Clifford (Founder & CEO): アメリカ国籍(推定)。スタンフォード大学の計算言語学博士課程を中退後、Rimeを創業。音声認識・合成の専門家。
- Brooke Larson (Co-founder): アメリカ国籍(推定)。言語学者。Amazon Alexaの言語エンジニア、大学教授等の経歴を持つ。
- Ares Geovanos (Co-founder / COO): アメリカ国籍(推定)。カリフォルニア大学サンフランシスコ校(UCSF)で脳コンピュータインターフェースの研究に従事していたエンジニア。
- Nicklaus Salzman (VP of Revenue): 収益部門責任者。
