Pregúntale a ocho personas diferentes su opinión y obtendrás ocho respuestas diferentes. El proyecto de código abierto Apache Cassandra está construido y mantenido por una colección de personas que llegan con sus propias motivaciones. A algunos les encantan las funciones nuevas. A algunos les encanta exprimir todo el rendimiento que pueden del sistema. Algunos quieren facilitar la vida de los operadores. ¿Qué los une a todos? Están trabajando como un equipo distribuido hacia un solo objetivo: una base de datos increíble que sigue mejorando.
Cassandra es un esfuerzo colaborativo de ingenieros de diferentes partes del mundo que comparten el objetivo común de crear el mejor producto posible. Abordan los problemas de sus empleadores mientras contribuyen al código fuente abierto del proyecto. Aquellos que se ganan la confianza de la comunidad y pueden realizar cambios en el código base se denominan "commiters". Convertirse en committer requiere dedicación y pasión por el proyecto. Recientemente, el proyecto realizó un evento llamado
Haddad nos dice que está ansioso por admitir Java 17 y sus recolectores de basura de baja latencia como ZGC en Cassandra 5.0. El exdesarrollador de Netflix y Apple, que se ha comprometido con Cassandra desde 2017, dice que estos recopiladores proporcionarán tiempos de pausa inferiores al milisegundo y un modelo de "establecer y olvidar", lo que hará que la administración de la memoria sea menos abrumadora para los usuarios de Cassandra. A medida que el proyecto madure y la gestión de la memoria mejore aún más, habrá mejoras en la duración y la frecuencia de las pausas del GC, lo que facilitará la ejecución de nodos más densos, lo que ahorrará dinero a los usuarios.
“Eso significa que veremos pausas de GC menos frecuentes, y cuando sucedan, tomarán menos tiempo. Esto facilitará la ejecución de nodos más densos, lo que significa que su clúster será menos costoso de ejecutar. Me encanta la idea de ahorrar dinero simplemente haciendo una actualización”.
De la Peña , ingeniera de software de DataStax y committer de Cassandra desde 2016, está entusiasmada con la función de enmascaramiento dinámico de datos en Cassandra 5.0, que permite ocultar información confidencial al mismo tiempo que permite el acceso a las columnas enmascaradas. Esta función reemplaza los valores reales de las columnas con datos genéricos utilizando una serie de funciones SQL regulares que transforman los valores de las celdas. Los administradores pueden adjuntar estas funciones de enmascaramiento a las columnas del esquema de la tabla, por lo que los usuarios sin privilegios siempre verán datos enmascarados, incluso si no especifican las funciones en la consulta. El conjunto de funciones de enmascaramiento disponibles es relativamente pequeño en este momento, pero los usuarios pueden usar sus propias funciones definidas por el usuario para enmascarar, lo que facilita agregar tipos personalizados de enmascaramiento.
“Es una función de anonimización de seguridad que está disponible en muchas bases de datos.
y está muy atrasado en Cassandra.
Chella, líder sénior de ingeniería en Netflix y comprometida desde 2019, está entusiasmada con las nuevas características de Cassandra 5.0 que brindan más protecciones para los desarrolladores, mejoran la estabilidad y mejoran la experiencia operativa. La introducción de medidas de seguridad en Cassandra 4.1 permitió límites flexibles y estrictos en las acciones del usuario, y Cassandra 5.0 agrega varias medidas de seguridad nuevas para aumentar la confiabilidad, la disponibilidad y la experiencia del usuario. Estas medidas de seguridad codifican las mejores prácticas y evitan errores catastróficos, como la eliminación de espacios clave críticos para la producción o la pérdida de datos.
"Estas barandillas ciertamente ayudan a prevenir muchos de estos momentos de 'ups'".
Semb Weaver, un committer de Cassandra desde 2016 y arquitecto principal en DataStax, aprecia cómo Cassandra 5.0 encarna el "código abierto real", al tener múltiples proveedores, empresas y empleados detrás de sus colaboradores. Esto crea una comunidad de desarrollo diversa con un amplio conjunto de funciones y aplicaciones, y enfatiza la importancia de la higiene de la ingeniería, la construcción de QA y CI para mejorar la confianza y habilitar funciones radicales. Él dice que estos principios y prácticas conducirán a una mayor longevidad, sostenibilidad y modernización de la tecnología, y que fomenta la diversidad y la colaboración en la comunidad.
“Es lo que permite algunas de las funciones radicales que vienen en 5.0, cosas como Accord, que no podemos cruzar la línea de meta si no trabajamos todos juntos como un equipo”.
West, un ingeniero de software sénior de Netflix y Cassandra Committer desde 2020, está entusiasmado con la forma en que las mejoras en Cassandra 5.0 conducirán a una mejor confiabilidad y rendimiento, lo que le permitirá dormir más como ingeniero de guardia. Destaca la nueva función de metadatos transaccionales y las tablas de memoria mejoradas que permitirán más escrituras más rápido. También describe cómo las nuevas tablas virtuales, diagnósticos y métricas proporcionarán más información sobre Cassandra y ayudarán a resolver incidentes más rápido.
“Sé que con Cassandra 5.0 [que] cuando me acuesto, es menos probable que me despierten, y cuando lo haga, resolveré nuestros problemas más rápido y volveré a la cama más rápido”.
Como ingeniera de DataStax que se ha comprometido desde 2020, Dimitrova espera ansiosamente la implementación del protocolo Accord por parte de la comunidad. Este protocolo permitirá el consenso global y permitirá que las transacciones ACID se realicen a escala, lo que hará que los desarrolladores sean más eficientes sin comprometer el rendimiento o la escalabilidad. El consenso global es crucial en cosas como las transferencias bancarias; Las garantías de concurrencia aseguran que solo un proceso puede hacer cambios a la vez. La nueva sintaxis que estamos creando para los desarrolladores incluirá declaraciones de transacciones de inicio y confirmación, que permiten que todas las operaciones dentro de la declaración sean totalmente compatibles con ACID.
A Polonia, líder tecnológico de DataStax que se convirtió en comprometido en 2021, le gustan los beneficios de la estrategia de compactación unificada (UCS) de Cassandra 5.0, que combina estrategias de compactación heredadas antiguas como CT, estrategias de compactación por niveles y por niveles. UCS es una estrategia de compactación significativamente más rápida que ha reducido la sobrecarga de espacio y permite el paralelismo. La estrategia también tiene un factor de escala que se puede ajustar a cargas de trabajo específicas, ya sea que tengan muchas lecturas o escritura, o ambas. No hay necesidad de saber cómo funcionan las estrategias heredadas y no hay gastos generales para migrar a UCS.
“Si necesita que tenga mucha escritura, puede ajustarlo a eso; si necesita que tenga muchas lecturas, puede ajustarlo; y si solo quiere algo intermedio, funciona bien para cualquier carga de trabajo”.
Lerer se convirtió en committer hace ocho años. El líder tecnológico de DataStax señala que el índice secundario conectado al almacenamiento (SASI) se agregó en 2016, pero no se invirtió lo suficiente y tuvo que comercializarse experimentalmente en Cassandra 4.0, ya que no cumplía con los estándares deseados. SAI se ha construido sobre SASI y tiene su propio conjunto de innovaciones, incluida la capacidad de indexar varias columnas sin problemas de escalabilidad y optimización para el uso del espacio y consultas numéricas.
"SAI permitirá un nuevo conjunto de capacidades de consulta, sin los inconvenientes que tenían la indexación secundaria o SASI".
Lambov, un ingeniero de DataStax que se ha comprometido con Cassandra desde 2015, está entusiasmado con la capacidad de conexión del almacenamiento local en Cassandra 5.0. El cambio se centra en la tabla de memoria, que es un área de almacenamiento temporal en la memoria de la computadora donde los datos se almacenan antes de escribirse en un almacenamiento más permanente. El objetivo de la nueva implementación es facilitar el uso de diferentes tipos de tablas de memoria y seleccionar la mejor para cada caso de uso específico. Una de las nuevas implementaciones se basa en un
Explorar un proyecto de código abierto exitoso es un viaje cautivador, tanto desde el punto de vista humano como tecnológico. Si bien la tecnología puede ser el enfoque inicial de un proyecto de software, son las personas involucradas las que lo hacen realmente fascinante. Cada persona trae sus emociones y deseos únicos a la mesa, lo que puede resultar en resultados positivos o negativos. En un proyecto de código abierto, los deseos de los individuos de mejorar algo quedan al descubierto y abiertos a la crítica. Sin embargo, es a través de la determinación de trabajar juntos y avanzar que ocurre la verdadera magia del proyecto.
¿Qué características espera con ansias en Cassandra 5.0? Personalmente, estoy entusiasmado con las mejoras de los desarrolladores que cambiarán las reglas del juego, como las transacciones ACID, los nuevos esquemas de indexación y la nueva sintaxis como el operador NOT. Como committer de Cassandra, disfruto viendo a los desarrolladores usar estas nuevas características y crear cosas asombrosas. Si hace tiempo que no echas un vistazo a Cassandra, ahora es un buen momento para hacerlo. Únase al resto de la comunidad de usuarios en
También publicado aquí .