マイクロソフトの研究者らが最近、大規模言語モデル(LLM)がスプレッドシートの解析で直面する課題を解決することを目的とした、SpreadsheetLLMという革新的な研究を発表しました。

7月12日にArxivで発表された論文によると、SpreadsheetLLMは、LLMがスプレッドシートの内容を「理解」できるようにするエンコーディングフレームワークを採用しています。この研究は、スプレッドシートのデータ管理と分析の効率を大幅に向上させ、複雑な数式や操作を習得する必要なく、自然言語でAIに質問できるようにすることを目指しています。

image.png

論文はこちら:https://arxiv.org/html/2407.09025v1#abstract

スプレッドシートは、LLMにとって様々な課題をもたらします。まず、スプレッドシートのサイズは非常に大きくなり、LLMの一度に処理できる文字数を超える可能性があります。次に、スプレッドシートは二次元レイアウトと構造を採用していますが、LLMは線形かつ順序付けられた入力を得意としています。最後に、LLMは通常、セルアドレスや特定のスプレッドシート形式を解釈するための特別なトレーニングを受けていません。

マイクロソフトのSpreadsheetLLM技術は、主に2つの部分で構成されています。1つ目はSheetCompressorで、スプレッドシートの複雑さを軽減し、LLMがより理解しやすくなるようにします。SheetCompressorには、構造アンカー、トークン数の削減方法、類似セルのクラスタリングによる効率向上という3つのモジュールが含まれています。これらのモジュールを利用することで、マイクロソフトのチームは、必要なトークン数を96%削減し、12.3%の改善効果を達成しました。2つ目はChain of Spreadsheetで、これはLLMが圧縮されたスプレッドシート内で関連情報を見つけ出し、回答を生成する方法を学習させます。

image.png

この技術の成功は、マイクロソフトのCopilotのExcelにおける機能を大幅に向上させ、より複雑なデータ分析タスクを処理できるようにします。しかし、現在この方法は、生成データの正確性と高い計算資源消費という問題に直面しています。研究チームは今後、セルの背景色のエンコーディングと、セルの内容間の関連性の理解を深めることを計画しています。

要点:

📊 **大規模言語モデル(LLM)にとってのスプレッドシートの課題**: スプレッドシートは構造が複雑で二次元レイアウトのため、LLMが通常処理する線形入力の範囲を超えています。

🔍 **SpreadsheetLLM技術の解説**: マイクロソフトはSheetCompressorとChain of Spreadsheetという2つの主要技術を提案し、LLMによるスプレッドシートの理解能力を大幅に向上させました。

🛠️ **マイクロソフトのAIツールへの影響**: SpreadsheetLLMは、マイクロソフトCopilotのExcelにおける適用能力を強化する可能性がありますが、現在、生成データの正確性と計算資源消費の問題が残っています。