最近、マイクロソフトはカリフォルニア大学バークレー校、イリノイ大学などの研究機関と共同で、AIOpsLabという名前のプロジェクトをオープンソース化しました。これは、クラウドの自動化運用にインテリジェントなエージェントシステムを提供することを目的としています。AIOpsLabは、実際のクラウドサービス環境における複雑な操作タスクをシミュレートし、障害の自動検出、特定、解決をサポートすることで、クラウドサービスの可観測性と運用効率を大幅に向上させます。

802df291fffba9010d723a8a951a7a87.png

AIOpsLabの主な機能は、モジュール式設計により、人間とデジタルエージェントの協調作業をサポートし、開発者がアプリケーションを拡張したり、さまざまなワークロードや障害シナリオを処理したりすることを容易にすることです。そのアーキテクチャは、コーディネーター、サービス、ワークロードジェネレーター、障害ジェネレーター、可観測性の5つの主要部分で構成されています。

コーディネーターは、エージェントとのセッションを確立し、ベンチマークテストの問題に関する情報を共有します。ログや指標の取得など、一連の文書化されたAPIを呼び出すことで、エージェントがタスクを効率的に解決するのを支援します。また、サービスの拡張や再展開など、エージェントを代表して操作を行い、エージェントが実際の環境で円滑に動作できるようにします。

サービスモジュールは、マイクロサービス、サーバーレス、モノリシックサービスなど、さまざまな実際のクラウドサービス環境に適応できます。AIOpsLabは、オープンソースアプリケーションスイートDeathStarBenchも活用しており、研究者にとって、制御された環境で本番環境のイベントを再現して調査するためのツールを提供します。さらに、Blueprintなどのツールを統合することで、AIOpsLabは他の学術および本番サービスにも拡張でき、新しいバリアントの迅速な展開が容易になります。

ワークロードジェネレーターはAIOpsLabにおいて重要な役割を果たし、正常なシナリオと障害シナリオのシミュレーションを作成して、さまざまな条件下でのエージェントのパフォーマンスをテストします。コーディネーターの仕様に従って対応するワークロードを生成し、ユーザーがさまざまな状況でテストできるようにします。

障害ジェネレーターはAIOpsLabの革新的な機能であり、さまざまなクラウドシナリオで詳細な障害注入を実行できます。この機能は、複雑な障害の全プロセスをシミュレートし、マイクロサービス間の相互依存性を考慮することで、ユーザーに包括的なテストと評価能力を提供します。

最後に、可観測性機能は、複数の監視ツールを統合することで、AIOpsLabの包括的な監視能力を高め、ユーザーがカスタマイズされたシステム情報を取得できるようにし、潜在的なデータ過負荷の状況でも効率的な管理を可能にします。

オープンソースアドレス:https://github.com/microsoft/AIOpsLab/?tab=readme-ov-file

重要なポイント:

🌐 マイクロソフトと大学が共同でAIOpsLabをオープンソース化し、クラウドサービスの自動化運用能力の向上を目指しています。

🛠️ AIOpsLabは、コーディネーター、サービス、ワークロードジェネレーター、障害ジェネレーター、可観測性の5つの主要部分で構成され、さまざまなクラウドサービス環境をサポートしています。

🔍 可観測性機能は複数の監視ツールを統合し、ユーザーに効果的なシステム情報と監視能力を提供します。