マイクロソフトは、公式サイトでグラフベースのRAG(検索強化生成)であるGraphRAGをオープンソース化しました。このシステムは、エンティティ知識グラフを構築することで、大規模言語モデルの検索、質問応答、要約、推論などの能力を強化し、特に大規模データセットの処理に優れています。
プロジェクト入口:https://top.aibase.com/tool/graphrag
従来のRAGシステムは、外部データソースを処理する際に、局所的なテキスト断片の検索に過度に依存しており、データセット全体の概要を捉えることができませんでしたが、GraphRAGはエンティティ知識グラフを構築することで、大規模言語モデルがテキスト内の複雑な関係性と相互作用をより適切に捉え、グローバルな検索能力を実現します。
GraphRAGの中核は、エンティティ知識グラフの構築とコミュニティ要約の生成の2つのステップで構成されています。コミュニティ要約により、GraphRAGはデータセット全体から関連情報を抽出し、より包括的で正確な回答を生成できます。さらに、GraphRAGはトークンの必要量が少なく、開発者は大幅なコスト削減を実現できます。
マイクロソフトは、100万トークン、超複雑な構造のデータセットでGraphRAGの包括的なテストを実施しました。その結果、GraphRAGはNaive RAGなどの手法を上回り、包括性と多様性のテストで優れた成績を収め、ポッドキャストのトランスクリプトとニュース記事のデータセットでも非常に高いレベルを示し、現在最高のRAG手法の一つであることが示されました。
重要なポイント:
- 💡 GraphRAGはエンティティ知識グラフを構築することで、大規模言語モデルの検索、質問応答、要約、推論などの能力を強化し、特に大規模データセットの処理に優れています。
- 💡 GraphRAGの中核は、エンティティ知識グラフの構築とコミュニティ要約の生成の2つのステップで構成されており、コミュニティ要約によってデータセットから関連情報を抽出し、より包括的で正確な回答を生成します。
- 💡 GraphRAGはトークンの必要量が少なく、開発者のコスト削減に役立ちます。包括的なテストで優れた成果を示しており、現在最高のRAG手法の一つです。