Microsoft GraphRAG
公式サイト1. サービス概要
Microsoft GraphRAGは、Microsoft Researchが開発したオープンソースフレームワークであり、ナレッジグラフとRAG(Retrieval-Augmented Generation)を組み合わせた次世代の情報検索・生成手法を実現する。従来のベクトル検索ベースのRAGでは対応が難しかった、コーパス全体にまたがるグローバルな質問(例:「このデータセットの主要なテーマは何か」)に対して、構造化されたナレッジグラフを活用することで高品質な回答を生成できる。ドキュメントからLLMを使用してエンティティとリレーションシップを自動抽出し、グラフコミュニティの階層的な要約を構築する。ローカル検索(特定のエンティティに関する質問)とグローバル検索(コーパス全体に関する質問)の両方をサポートしている。
2. 使用している技術スタック
- 開発言語: Python
- LLM連携: Azure OpenAI Service、OpenAI API
- グラフ処理: NetworkX、Graspologic(コミュニティ検出にLeidenアルゴリズムを使用)
- ベクトル検索: Azure AI Search、ローカルベクトルストア
- データ処理パイプライン: LLMベースのエンティティ・リレーションシップ抽出
- コミュニティ検出: Leidenアルゴリズムによる階層的クラスタリング
- ストレージ: Parquet形式、CSVエクスポート対応
- ライセンス: MIT License
- リポジトリ: https://github.com/microsoft/graphrag
3. 会社概要
| 項目 | 内容 |
|---|---|
| 開発元 | Microsoft Research |
| 親会社 | Microsoft Corporation |
| 本社所在地 | アメリカ合衆国ワシントン州レドモンド |
| プロジェクト開始 | 2023年 |
| 公開年 | 2024年 |
| ライセンス | MIT License |
| ウェブサイト | https://microsoft.github.io/graphrag/ |
4. 沿革、資本構成、国籍、役員情報
沿革
- 2023年: Microsoft Researchにて、従来のRAGの限界を克服するための研究プロジェクトとしてGraphRAGの開発が開始
- 2024年2月: 研究論文「From Local to Global: A Graph RAG Approach to Query-Focused Summarization」を公開
- 2024年4月: GraphRAGのコンセプトとアーキテクチャをMicrosoft Researchブログで公開
- 2024年7月: GitHubにてオープンソースとしてコードを公開(MIT License)
- 2024年後半: コミュニティからの貢献が活発化、複数のグラフデータベースバックエンド(Neo4j、CosmosDB等)との統合が進展
- 2025年: Azure AI Foundryへの統合、エンタープライズ向け機能の拡充
資本構成
Microsoft GraphRAGはMicrosoft Researchの研究プロジェクトとして開発されたオープンソースソフトウェアであり、独立した資金調達は行われていない。Microsoft Corporation(NASDAQ: MSFT)の研究開発予算により支援されている。
国籍
アメリカ合衆国。Microsoft Researchのレドモンド研究所を中心に開発。
役員情報(プロジェクトリーダー)
| 役職 | 氏名 |
|---|---|
| 主要研究者 | Darren Edge |
| 研究者 | Ha Trinh |
| 研究者 | Newman Cheng |
GraphRAGプロジェクトはMicrosoft ResearchのAI Frontiers部門が主導しており、Darren Edgeが中心的な研究者として知られている。
