Kürzlich haben Microsoft und Forschungseinrichtungen wie die University of California, Berkeley und die University of Illinois ein Open-Source-Projekt namens AIOpsLab veröffentlicht, das darauf abzielt, ein intelligentes Agentensystem für die Cloud-Automatisierung und -Wartung bereitzustellen. AIOpsLab kann komplexe Aufgaben in realen Cloud-Umgebungen simulieren und unterstützt die automatische Erkennung, Lokalisierung und Behebung von Fehlern, wodurch die Beobachtbarkeit und Effizienz der Cloud-Dienste deutlich verbessert werden.
Die Hauptfunktion von AIOpsLab besteht in seinem modularen Design, das die Zusammenarbeit zwischen Mensch und digitalem Agenten unterstützt und Entwicklern die Erweiterung von Anwendungen, die Verarbeitung verschiedener Workloads und Fehlerfälle erleichtert. Die Architektur besteht aus fünf Hauptkomponenten: Koordinator, Dienste, Workload-Generator, Fehlergenerator und Beobachtbarkeit.
Der Koordinator ist für die Einrichtung von Sitzungen mit intelligenten Agenten und das Teilen von Informationen zu Benchmark-Problemen zuständig. Er unterstützt die Agenten bei der effizienten Lösung von Aufgaben durch Aufrufen einer Reihe dokumentierter APIs (z. B. zum Abrufen von Protokollen und Metriken). Der Koordinator kann auch Aktionen im Namen des Agenten ausführen, z. B. Dienste erweitern oder neu bereitstellen, um sicherzustellen, dass der Agent in der realen Umgebung reibungslos funktioniert.
Das Dienstmodul kann an verschiedene reale Cloud-Umgebungen angepasst werden, z. B. Microservices, serverlose Architekturen und Monolithen. AIOpsLab nutzt auch das Open-Source-Anwendungspaket DeathStarBench, um Forschern ein Werkzeug zur Verfügung zu stellen, mit dem sie Produktionsereignisse in einer kontrollierten Umgebung reproduzieren und untersuchen können. Darüber hinaus kann AIOpsLab durch die Integration von Tools wie Blueprint auf andere akademische und produktive Dienste erweitert werden, um eine schnelle Bereitstellung neuer Varianten zu ermöglichen.
Der Workload-Generator spielt in AIOpsLab eine wichtige Rolle und ist für die Erstellung von Simulationen normaler und fehlerhafter Szenarien verantwortlich, um die Leistung der Agenten unter verschiedenen Bedingungen zu testen. Er generiert Workloads gemäß den Spezifikationen des Koordinators und unterstützt Benutzer bei Tests unter verschiedenen Bedingungen.
Der Fehlergenerator ist eine innovative Funktion von AIOpsLab und ermöglicht die Implementierung von feingranularer Fehlerinjektion in verschiedenen Cloud-Szenarien. Diese Funktion kann komplexe Fehlerabläufe simulieren und die gegenseitigen Abhängigkeiten zwischen Microservices berücksichtigen, um Benutzern umfassende Test- und Bewertungsfunktionen zu bieten.
Schließlich verbessert die Beobachtbarkeit durch die Integration verschiedener Überwachungstools die umfassende Überwachungsfähigkeit von AIOpsLab und stellt sicher, dass Benutzer maßgeschneiderte Systeminformationen erhalten, um ein effektives Management bei möglicher Datenüberlastung zu gewährleisten.
Open-Source-Adresse: https://github.com/microsoft/AIOpsLab/?tab=readme-ov-file
Wichtigste Punkte:
🌐 Microsoft und Universitäten veröffentlichen gemeinsam AIOpsLab als Open-Source-Projekt, um die automatisierte Wartung von Cloud-Diensten zu verbessern.
🛠️ AIOpsLab besteht aus fünf Hauptkomponenten: Koordinator, Dienste, Workload-Generator, Fehlergenerator und Beobachtbarkeit und unterstützt verschiedene Cloud-Umgebungen.
🔍 Die Beobachtbarkeit integriert verschiedene Überwachungstools, um Benutzern effektive Systeminformationen und Überwachungsfunktionen zu bieten.