Recentemente, a Microsoft, em colaboração com instituições de pesquisa como a Universidade da Califórnia, Berkeley, e a Universidade de Illinois, lançou um projeto de código aberto chamado AIOpsLab, com o objetivo de fornecer um sistema de agentes inteligentes para automação e operações de nuvem. O AIOpsLab pode simular tarefas complexas em ambientes de serviços em nuvem reais, suportando a detecção, localização e resolução automáticas de falhas, melhorando significativamente a observabilidade e a eficiência operacional dos serviços em nuvem.

802df291fffba9010d723a8a951a7a87.png

A principal função do AIOpsLab é, através de um design modular, suportar a colaboração entre humanos e agentes digitais, facilitando o desenvolvimento de aplicativos, o tratamento de diferentes cargas de trabalho e cenários de falhas. Sua arquitetura é composta por cinco partes principais: coordenador, serviços, gerador de carga de trabalho, gerador de falhas e observabilidade.

O coordenador é responsável por estabelecer sessões com os agentes e compartilhar informações sobre os problemas de teste de referência. Ele auxilia os agentes na resolução eficaz de tarefas através da chamada de uma série de APIs documentadas (como obtenção de logs, métricas, etc.). O coordenador também pode executar operações em nome dos agentes, como dimensionar ou reimplantar serviços, garantindo que os agentes possam operar sem problemas em um ambiente real.

O módulo de serviços pode se adaptar a vários ambientes de serviços em nuvem reais, como microsserviços, sem servidor e serviços monolíticos. O AIOpsLab também utiliza o pacote de aplicativos de código aberto DeathStarBench, fornecendo aos pesquisadores uma ferramenta para reproduzir e estudar eventos de produção em um ambiente controlado. Além disso, através da integração de ferramentas como o Blueprint, o AIOpsLab pode ser expandido para outros serviços acadêmicos e de produção, facilitando a implantação rápida de novas variantes.

O gerador de carga de trabalho desempenha um papel importante no AIOpsLab, sendo responsável pela criação de simulações de cenários normais e de falhas para testar o desempenho dos agentes em diferentes condições. Ele gera cargas de trabalho de acordo com as especificações do coordenador, ajudando os usuários a realizar testes em diversas situações.

O gerador de falhas é uma função inovadora do AIOpsLab, capaz de injetar falhas granulares em vários cenários de nuvem. Essa função pode simular todo o processo de falhas complexas, considerando as interdependências entre microsserviços, fornecendo aos usuários recursos completos de teste e avaliação.

Finalmente, a função de observabilidade, integrando várias ferramentas de monitoramento, melhora a capacidade de monitoramento abrangente do AIOpsLab, garantindo que os usuários obtenham informações personalizadas do sistema para gerenciamento eficaz, mesmo em casos de possível sobrecarga de dados.

Endereço do código aberto: https://github.com/microsoft/AIOpsLab/?tab=readme-ov-file

Destaques:

🌐 A Microsoft, em conjunto com universidades, lança o AIOpsLab de código aberto, com o objetivo de melhorar a capacidade de automação e operações de serviços em nuvem.

🛠️ O AIOpsLab é composto por cinco partes principais: coordenador, serviços, gerador de carga de trabalho, gerador de falhas e observabilidade, suportando diversos ambientes de serviços em nuvem.

🔍 A função de observabilidade integra várias ferramentas de monitoramento, garantindo que os usuários obtenham informações e capacidade de monitoramento eficazes do sistema.