Forscher von Microsoft haben kürzlich eine innovative Studie namens SpreadsheetLLM veröffentlicht, die sich mit den Herausforderungen befasst, die große Sprachmodelle (LLMs) beim Parsen von Tabellenkalkulationen haben.

Laut einem am 12. Juli auf Arxiv veröffentlichten Artikel ermöglicht SpreadsheetLLM durch ein Codierungsframework LLMs, den Inhalt von Tabellenkalkulationen zu „verstehen“. Diese Forschung verspricht eine deutliche Verbesserung der Datenverwaltung und -analyse in Tabellenkalkulationen und ermöglicht es Benutzern, dem KI-System Fragen in natürlicher Sprache zu stellen, ohne komplexe Formeln und Operationen beherrschen zu müssen.

image.png

Artikel-Link: https://arxiv.org/html/2407.09025v1#abstract

Tabellenkalkulationen stellen LLMs vor vielfältige Herausforderungen. Erstens können Tabellenkalkulationen sehr umfangreich sein und die Grenze der Zeichenanzahl überschreiten, die ein LLM auf einmal verarbeiten kann. Zweitens verwenden Tabellenkalkulationen ein zweidimensionales Layout und eine zweidimensionale Struktur, während LLMs die Verarbeitung linearer, sequenzieller Eingaben bevorzugen. Drittens sind LLMs in der Regel nicht speziell darauf trainiert, Zellenadressen und spezifische Tabellenkalkulationsformate zu interpretieren.

Die SpreadsheetLLM-Technologie von Microsoft besteht aus zwei Hauptteilen. Der erste Teil ist SheetCompressor, der die Komplexität von Tabellenkalkulationen reduziert und sie für LLMs leichter verständlich macht. SheetCompressor umfasst drei Module: Strukturanker, Methoden zur Reduzierung der Token-Anzahl und die Steigerung der Effizienz durch Gruppierung ähnlicher Zellen. Mit diesen Modulen reduzierte das Microsoft-Team die für die Codierung benötigte Token-Anzahl um 96 % und erzielte eine Verbesserung von 12,3 %. Der zweite Teil ist Chain of Spreadsheet, der LLMs beibringt, wie sie in der komprimierten Tabellenkalkulation relevante Informationen finden und Antworten generieren können.

image.png

Die erfolgreiche Anwendung dieser Technologie wird die Funktionalität von Microsoft Copilot in Excel deutlich verbessern und es ihm ermöglichen, komplexere Datenanalyseaufgaben zu bewältigen. Derzeit weist diese Methode jedoch immer noch Probleme hinsichtlich der Genauigkeit der generierten Daten und des hohen Verbrauchs an Rechenressourcen auf. Die zukünftigen Pläne des Forschungsteams umfassen die Codierung von Zellhintergrundfarben und ein vertieftes Verständnis der Zusammenhänge zwischen Zelleninhalten.

Wichtigste Punkte:

📊 **Herausforderungen von Tabellenkalkulationen für große Sprachmodelle (LLMs)**: Tabellenkalkulationen haben eine komplexe Struktur und ein zweidimensionales Layout, die über den üblichen Bereich linearer Eingaben von LLMs hinausgehen.   

🔍 **Analyse der SpreadsheetLLM-Technologie**: Microsoft hat die beiden Kerntechnologien SheetCompressor und Chain of Spreadsheet vorgestellt, die das Verständnis von Tabellenkalkulationen durch LLMs erheblich verbessert haben.   

🛠️ **Auswirkungen auf Microsoft-KI-Tools**: SpreadsheetLLM dürfte die Anwendungsmöglichkeiten von Microsoft Copilot in Excel verbessern, steht aber derzeit noch vor Herausforderungen hinsichtlich der Genauigkeit der Datengenerierung und des Verbrauchs von Rechenressourcen.