Dagster
公式サイト1. サービス概要
Dagster は、データパイプラインの構築、スケジュール管理、およびモニタリングを行うためのクラウドネイティブなデータオーケストレーションプラットフォームです。従来のタスクベース(ワークフロー中心)のツールとは異なり、「ソフトウェア定義アセット(Software-Defined Assets)」という概念を提唱し、データそのもの(テーブルやファイル)の状態管理に重点を置いているのが特徴です。
- 主な機能:
- 宣言型アセット管理: パイプラインを「タスクの順序」ではなく「生成されるデータアセット」として定義。
- 統合UI(Dagster UI): データリネージ(依存関係)の可視化、実行ログの監視、カタログ機能を提供。
- 高度なテスト機能: ローカル環境でのユニットテストや結合テストが容易。
- 豊富な統合: dbt, Airbyte, Snowflake, Databricks, Kubernetes など主要なデータツールと連携。
- ユーザー数: 具体的な総ユーザー数は非公開。ただし、GitHub上では約1.1万Star(2026年時点)を獲得しており、フォーチュン500企業を含む数千のデータチームに採用されています。
- 対応プラットフォーム: Pythonが動作する環境であれば制限はありません。
- セルフホスト: Docker, Kubernetes, オンプレミス。
- マネージドサービス: Dagster+(旧 Dagster Cloud。AWS、Azure、GCP上のマネージド環境)。
2. 使用している技術スタック
Dagster は、データエンジニアリングに馴染みのある Python を核としつつ、モダンな Web 技術を組み合わせて構築されています。
- 言語:
- バックエンド: Python (コアロジック、パイプライン定義)
- フロントエンド: TypeScript, JavaScript (UI部分)
- フレームワーク・ライブラリ:
- Webフレームワーク: React (UI コンポーネント)
- API: GraphQL (システム間通信およびUIとサーバー間の通信)
- インフラ・ミドルウェア:
- データベース: PostgreSQL (メタデータ、実行履歴の保存用デフォルト)
- コンテナ・オーケストレーション: Docker, Kubernetes (実行環境の標準)
- 通信プロトコル: gRPC (内部プロセス間通信)
3. 会社概要
Dagster の開発・運営は、米国の Dagster Labs(旧称:Elementl)が行っています。
- 運営会社名: Dagster Labs, Inc.
- 設立年: 2018年
- 本社所在地: 米国 カリフォルニア州 サンフランシスコ(San Francisco, CA)
- 従業員数: 約80名〜100名(2025年時点の推計)
4. 沿革、資本構成、国籍、役員情報
Dagster Labs は、Facebook(現Meta)で GraphQL を共同開発したエンジニアによって設立された企業です。
- 沿革:
- 2018年:Elementl として設立。オープンソース版 Dagster を公開。
- 2022年:製品名を冠した Dagster Labs に社名変更。
- 2024年:マネージドサービスを「Dagster+」としてリブランディング。
- 資本構成:
- シリーズBラウンド等を経て、累計約5,500万ドル以上を調達。
- 主な投資家:Sequoia Capital, Index Ventures, Amplify Partners, Slow Ventures, 8VC。
- 国籍: 米国
- 役員情報:
- Pete Hunt(CEO): 米国籍。Facebook の初期メンバーで React の開発に貢献。その後、Twitter の広告・予測チームを経て、不正検知スタートアップ Smyte を創業(Twitter が買収)。2022年より現職。
- Nick Schrock(Founder / CTO): 米国籍。Facebook に8年間在籍し、GraphQL の共同開発者として著名。Dagster の生みの親であり、当初は CEO を務めていたが、技術開発に注力するため CTO へ転身。
- Bosmat Eldar(Head of Engineering): 米国籍。Facebook および Carbon Health でのエンジニアリングマネジメント経験を経て、Dagster の開発を統括。
