La comunidad de Apache Cassandra ha anunciado recientemente el lanzamiento oficial de Cassandra 5.0. Esta actualización no solo mejora la eficiencia de los datos, sino que también incorpora funciones de IA generativa (GenAI) y un rendimiento optimizado. Como base de datos NoSQL distribuida y de código abierto, Cassandra puede gestionar eficazmente grandes cantidades de datos distribuidos en múltiples servidores, garantizando alta disponibilidad y tolerancia a fallos.
La versión Cassandra 5.0 presenta avances significativos, siendo la más destacada la nueva función de índices adjuntos de almacenamiento (SAI). Anteriormente, los usuarios necesitaban definir los datos estrictamente, pero ahora los desarrolladores pueden realizar consultas con mayor flexibilidad, sin estar limitados a estructuras de datos fijas. Esto significa que las consultas que no son de clave principal son más eficientes, y el uso de índices secundarios es más sencillo, reduciendo la carga del sistema.
Además, Cassandra 5.0 amplía las funcionalidades de la base de datos, incorporando la búsqueda vectorial (Vector Search) y nuevos tipos de datos vectoriales. Estas funciones son cruciales para proyectos de IA y aprendizaje automático, permitiendo una mejor gestión de la similitud, almacenamiento y recuperación de vectores incrustados, lo que mejora el rendimiento de motores de recomendación, detección de fraudes, reconocimiento de imágenes y chatbots de IA.
La actualización también incluye una estrategia de compresión unificada, lo que aumenta considerablemente la densidad de datos en cada nodo. En comparación con el límite anterior de cuatro TB por nodo, Cassandra 5.0 ahora admite diez TB o incluso más. Esta mejora permite a las empresas reducir el número de nodos en implementaciones a gran escala, disminuyendo así los costes operativos.
Asimismo, Cassandra 5.0 presenta un nuevo par de estructuras de datos, llamadas trie memtables y trie SSTables, que mejoran la conexión entre los datos introducidos por el usuario y el almacenamiento en disco, reduciendo el tiempo de procesamiento y conversión innecesarios, lo que resulta en una extracción de datos más rápida y eficiente desde la memoria o el disco.
Este lanzamiento es la primera actualización importante desde el lanzamiento de Cassandra 4.0 en 2021. Desde entonces, la comunidad de Apache Cassandra se ha centrado en el desarrollo de la versión 5.0, introduciendo una serie de nuevas características y funciones para mejorar su rendimiento y aplicabilidad. Los usuarios pueden migrar de la versión 4.0 a la 5.0 mediante una actualización en línea, minimizando el tiempo de inactividad de la aplicación. Con el lanzamiento de Cassandra 5.0, el ciclo de vida de la serie 3.x también llega a su fin, por lo que los usuarios deben planificar su estrategia de actualización lo antes posible para asegurar el soporte y las actualizaciones de seguridad continuas.
En el futuro, la comunidad de Cassandra continuará impulsando el desarrollo de la versión 5.1, que se espera que implemente transacciones ACID completas (Atomicidad, Consistencia, Aislamiento, Durabilidad) para ampliar la aplicabilidad de la base de datos en nuevos casos de uso.
Puntos clave:
🔍 Nueva función de índices adjuntos de almacenamiento (SAI) para consultas más flexibles y eficientes.
🚀 Incorporación de búsqueda vectorial y nuevos tipos de datos vectoriales, que impulsan los proyectos de IA y aprendizaje automático.
💾 Capacidad de datos de cada nodo aumentada a 10 TB, reduciendo los costes operativos de las empresas.