A comunidade Apache Cassandra anunciou recentemente o lançamento oficial do Cassandra 5.0. Esta atualização não apenas melhora a eficiência dos dados, mas também adiciona recursos de IA generativa (GenAI) e desempenho otimizado. Como um banco de dados NoSQL distribuído e de código aberto, o Cassandra pode gerenciar grandes quantidades de dados em vários servidores, garantindo alta disponibilidade e tolerância a falhas.

image.png

A versão Cassandra 5.0 traz melhorias significativas, sendo a mais notável a nova funcionalidade de índices anexados ao armazenamento (SAI). Anteriormente, os usuários precisavam definir os dados de forma rígida, mas agora os desenvolvedores podem realizar consultas com mais flexibilidade, sem se limitar a estruturas de dados fixas. Isso significa que as consultas em campos que não são chaves primárias se tornam mais eficientes, e o uso de índices secundários também se torna mais simples, reduzindo a carga do sistema.

Além disso, o Cassandra 5.0 expandiu as funcionalidades do banco de dados, adicionando pesquisa vetorial (Vector Search) e novos tipos de dados vetoriais. Esses recursos são essenciais para projetos de IA e aprendizado de máquina, permitindo melhor similaridade, armazenamento e recuperação de vetores incorporados, melhorando assim o desempenho de mecanismos de recomendação, detecção de fraudes, reconhecimento de imagens e chatbots de IA.

A atualização também introduziu uma estratégia de compactação unificada, aumentando significativamente a densidade de dados em cada nó. Em comparação com o limite anterior de quatro terabytes por nó, o Cassandra 5.0 agora suporta dez terabytes ou mais. Essa melhoria permite que usuários corporativos reduzam o número de nós em implantações em larga escala, reduzindo assim os custos operacionais.

Além disso, o Cassandra 5.0 introduziu um par de novas estruturas de dados, chamadas trie memtables e trie SSTables. Essas estruturas melhoram a interação entre os dados inseridos pelo usuário e o armazenamento em disco, reduzindo tempos de processamento e conversão desnecessários, tornando a recuperação de dados da memória ou do disco mais rápida e eficiente.

Este lançamento é a primeira grande atualização desde o lançamento do Cassandra 4.0 em 2021. Desde então, a comunidade Apache Cassandra se concentrou no desenvolvimento do 5.0, lançando uma série de novos recursos e funcionalidades para melhorar seu desempenho e aplicabilidade. Os usuários podem migrar da versão 4.0 para a 5.0 por meio de uma atualização online, minimizando o tempo de inatividade do aplicativo. Com o lançamento do Cassandra 5.0, o ciclo de vida da série 3.x também chega ao fim, e os usuários devem planejar sua estratégia de atualização o mais rápido possível para garantir suporte e atualizações de segurança contínuas.

No futuro, a comunidade Cassandra continuará a desenvolver a versão 5.1, que espera implementar transações ACID completas (Atomicidade, Consistência, Isolamento, Durabilidade) para expandir a aplicabilidade do banco de dados em novos casos de uso.

Destaques:

🔍 Novo recurso de índices anexados ao armazenamento (SAI), tornando as consultas mais flexíveis e eficientes.

🚀 Introdução da pesquisa vetorial e novos tipos de dados vetoriais, auxiliando projetos de IA e aprendizado de máquina.

💾 Capacidade de dados de cada nó aumentada para 10 TB, reduzindo os custos operacionais das empresas.