paint-brush
Apache Cassandra 5.0 arrive : voici pourquoi les personnes qui l'ont construit sont excitéespar@datastax
1,250 lectures
1,250 lectures

Apache Cassandra 5.0 arrive : voici pourquoi les personnes qui l'ont construit sont excitées

par DataStax6m2023/07/31
Read on Terminal Reader

Trop long; Pour lire

Du masquage dynamique des données aux transactions ACID, les committers d'Apache Cassandra discutent de certains des changements importants et passionnants de la prochaine version 5.0.
featured image - Apache Cassandra 5.0 arrive : voici pourquoi les personnes qui l'ont construit sont excitées
DataStax HackerNoon profile picture
0-item
1-item


Demandez à huit personnes différentes leur opinion et vous obtiendrez huit réponses différentes. Le projet open source Apache Cassandra est construit et maintenu par un ensemble d'individus qui arrivent tous avec leurs propres motivations. Certains aiment les nouvelles fonctionnalités. Certains aiment extraire toutes les performances possibles du système. Certains veulent faciliter la vie des opérateurs. Qu'est-ce qui les lie tous ensemble ? Ils travaillent comme une équipe distribuée vers un seul objectif : une base de données incroyable qui ne cesse de s'améliorer.


Cassandra est un effort collaboratif d'ingénieurs de différentes parties du monde qui partagent un objectif commun de créer le meilleur produit possible. Ils s'attaquent aux problèmes de leurs employeurs tout en contribuant au code open source du projet. Ceux qui gagnent la confiance de la communauté et peuvent apporter des modifications au code de base sont appelés «committers». Devenir un committer demande du dévouement et de la passion pour le projet. Récemment, le projet a organisé un événement appelé Cassandre Attaquant , où certains des committers ont partagé leurs idées sur la prochaine version de Cassandra 5.0. Voici ce qu'ils avaient à dire.


Jean Haddad : Support de Java 17 et ramasse-miettes

Haddad nous dit qu'il attend avec impatience la prise en charge de Java 17 et de ses ramasse-miettes à faible latence comme ZGC dans Cassandra 5.0. L'ancien développeur de Netflix et d'Apple, engagé dans Cassandra depuis 2017, affirme que ces collecteurs fourniront des temps de pause inférieurs à la milliseconde et un modèle "définir et oublier", rendant la gestion de la mémoire moins écrasante pour les utilisateurs de Cassandra. Au fur et à mesure que le projet mûrit et que la gestion de la mémoire s'améliore, la durée et la fréquence des pauses du GC s'amélioreront, ce qui facilitera l'exécution de nœuds plus denses, ce qui fera économiser de l'argent aux utilisateurs.


"Cela signifie que nous verrons des pauses GC moins fréquentes - et quand elles se produiront, elles prendront moins de temps. Cela facilitera l'exécution de nœuds plus denses, ce qui signifie que votre cluster sera moins coûteux à exécuter. J'aime l'idée d'économiser de l'argent simplement en faisant une mise à niveau.


Andrés de la Peña : Masquage dynamique des données

De la Peña , ingénieur logiciel DataStax et committer Cassandra depuis 2016, est enthousiasmé par la fonction de masquage dynamique des données de Cassandra 5.0, qui permet de masquer les informations sensibles tout en permettant l'accès aux colonnes masquées. Cette fonctionnalité remplace les valeurs réelles des colonnes par des données génériques à l'aide d'une série de fonctions SQL classiques qui transforment les valeurs des cellules. Les administrateurs peuvent attacher ces fonctions de masquage aux colonnes du schéma de table, de sorte que les utilisateurs non privilégiés verront toujours les données masquées, même s'ils ne spécifient pas les fonctions dans la requête. L'ensemble des fonctions de masquage disponibles est relativement petit pour le moment, mais les utilisateurs peuvent utiliser leurs propres fonctions définies par l'utilisateur pour le masquage, ce qui facilite l'ajout de types de masquage personnalisés.


"Il s'agit d'une fonctionnalité d'anonymisation de sécurité disponible dans de nombreuses bases de données

et est attendu depuis longtemps à Cassandra.


Vinay Chella : Garde-corps

Chella, responsable senior de l'ingénierie chez Netflix et engagée depuis 2019, est enthousiasmée par les nouvelles fonctionnalités de Cassandra 5.0 qui offrent plus de garde-corps aux développeurs, améliorent la stabilité et améliorent l'expérience d'exploitation. L'introduction de garde-corps dans Cassandra 4.1 a permis des limites souples et strictes sur les actions de l'utilisateur, et Cassandra 5.0 ajoute plusieurs nouveaux garde-corps pour augmenter la fiabilité, la disponibilité et l'expérience utilisateur. Ces garde-corps codifient les meilleures pratiques et évitent les erreurs catastrophiques, telles que la suppression d'espaces clés critiques pour la production ou la perte de données.


"Ces garde-corps aident certainement à prévenir beaucoup de ces moments" oups "."


Mick Semb Wever : Communauté

Semb Weaver, un committer de Cassandra depuis 2016 et un architecte principal chez DataStax, apprécie la façon dont Cassandra 5.0 incarne le « véritable open source », en ayant plusieurs fournisseurs, entreprises et employés derrière ses contributeurs. Cela crée une communauté de développement diversifiée avec un riche ensemble de fonctionnalités et d'applications, et souligne l'importance de l'hygiène d'ingénierie, de la construction d'AQ et de CI pour améliorer la confiance et permettre des fonctionnalités radicales. Il affirme que ces principes et pratiques conduiront à une plus grande longévité, durabilité et modernisation de la technologie, et qu'ils encouragent la diversité et la collaboration au sein de la communauté.


"C'est ce qui permet à certaines des fonctionnalités radicales qui arrivent dans 5.0 - des trucs comme Accord - que nous ne pouvons pas franchir la ligne d'arrivée si nous ne travaillons pas tous ensemble en équipe."


Jordanie Ouest : Plus de sommeil!

West, un ingénieur logiciel principal de Netflix et Cassandra Committer depuis 2020, est ravi de la façon dont les améliorations de Cassandra 5.0 conduiront à une meilleure fiabilité et de meilleures performances, ce qui se traduira par plus de sommeil pour lui en tant qu'ingénieur de garde. Il met en évidence la nouvelle fonctionnalité de métadonnées transactionnelles et les memtables améliorés qui permettront plus d'écritures plus rapidement. Il décrit également comment les nouvelles tables virtuelles, diagnostics et métriques fourniront plus d'informations sur Cassandra et aideront à résoudre les incidents plus rapidement.


"Je sais qu'avec Cassandra 5.0 [that] quand je vais au lit, je suis moins susceptible de me réveiller - et quand je le fais, je vais résoudre nos problèmes plus rapidement et me remettre au lit plus rapidement. "


Ekaterina Dimitrova : Transactions Accord et ACID

Ingénieur DataStax engagé depuis 2020, Dimitrova attend avec impatience la mise en place du protocole Accord par la communauté. Ce protocole permettra un consensus mondial et permettra d'effectuer des transactions ACID à grande échelle, ce qui rendra les développeurs plus efficaces sans compromettre les performances ou l'évolutivité. Le consensus mondial est crucial dans des choses comme les virements bancaires; les garanties de simultanéité garantissent qu'un seul processus peut apporter des modifications à la fois. La nouvelle syntaxe que nous créons pour les développeurs inclura des déclarations de transaction begin et commit, qui permettent à toutes les opérations dans la déclaration d'être entièrement conformes à ACID.


Lorina Pologne : Stratégie de compactage unifiée

Poland, un responsable technique de DataStax qui est devenu un committer en 2021, apprécie les avantages de la stratégie de compactage unifiée (UCS) de Cassandra 5.0, qui combine d'anciennes stratégies de compactage telles que CT, des stratégies de compactage par niveau et par taille. L'UCS est une stratégie de compactage beaucoup plus rapide qui a réduit l'encombrement et permet le parallélisme. La stratégie a également un facteur de mise à l'échelle qui peut être adapté à des charges de travail spécifiques, qu'elles soient lourdes en lecture ou en écriture, ou les deux. Il n'est pas nécessaire de savoir comment fonctionnent les stratégies héritées et il n'y a aucune surcharge pour migrer vers UCS.


« Si vous avez besoin qu'il soit lourd en écriture, vous pouvez l'adapter à cela ; si vous avez besoin qu'il soit lourd en lecture, vous pouvez vous y adapter ; et si vous voulez juste quelque chose entre les deux, cela fonctionne bien quelle que soit votre charge de travail.


Benjamin Lerer : Indexation attachée au stockage

Lerer est devenu committer il y a huit ans. Le responsable technique de DataStax note que l'index secondaire attaché au stockage (SASI) a été ajouté en 2016, mais n'a pas été suffisamment investi et a dû être commercialisé à titre expérimental dans Cassandra 4.0 car il ne répondait pas aux normes souhaitées. SAI a été construit au-dessus de SASI et possède son propre ensemble d'innovations, notamment la possibilité d'indexer plusieurs colonnes sans problèmes d'évolutivité et l'optimisation de l'utilisation de l'espace et des requêtes de compression numérique.


"SAI permettra un nouvel ensemble de fonctionnalités de requête, sans les inconvénients de l'indexation secondaire ou SASI."


Branimir Lambov : Enfichabilité

Lambov, un ingénieur de DataStax engagé dans Cassandra depuis 2015, est enthousiasmé par la possibilité d'enficher le stockage local dans Cassandra 5.0. Le changement est centré sur la memtable, qui est une zone de stockage temporaire dans la mémoire de l'ordinateur où les données sont stockées avant d'être écrites dans un stockage plus permanent. L'objectif de la nouvelle implémentation est de faciliter l'utilisation de différents types de memtables et de sélectionner le meilleur pour chaque cas d'utilisation spécifique. L'une des nouvelles implémentations est basée sur un Essayer structure de données, qui fournit un moyen beaucoup plus efficace de stocker des données. Il permet également d'utiliser la mémoire hors du tas Java principal, ce qui évite le nettoyage de la mémoire pour les opérations de stockage. Ces améliorations peuvent doubler le débit d'écriture de la base de données. Il sera passionnant de voir où la communauté prendra ensuite cette interface de stockage flexible.


Dans OSS, les gens font toute la différence

Explorer un projet open-source réussi est un voyage captivant, tant du point de vue humain que technologique. Bien que la technologie puisse être l'objectif initial d'un projet logiciel, ce sont les personnes impliquées qui le rendent vraiment fascinant. Chaque personne apporte ses émotions et ses désirs uniques à la table, ce qui peut entraîner des résultats positifs ou négatifs. Dans un projet open-source, les désirs des individus d'améliorer quelque chose sont mis à nu et ouverts à la critique. Cependant, c'est dans la volonté de travailler ensemble et d'aller de l'avant que la vraie magie du projet opère.


Quelles fonctionnalités attendez-vous avec impatience dans Cassandra 5.0 ? Personnellement, je suis enthousiasmé par les améliorations apportées aux développeurs qui vont changer la donne, telles que les transactions ACID, les nouveaux schémas d'indexation et la nouvelle syntaxe comme l'opérateur NOT. En tant que committer Cassandra moi-même, j'aime regarder les développeurs utiliser ces nouvelles fonctionnalités et créer des choses incroyables. Si vous n'avez pas vérifié Cassandra depuis un moment, c'est le bon moment pour le faire. Rejoignez le reste de la communauté d'utilisateurs sur Planète Cassandre et partagez vos réflexions sur ce qui vous passionne à propos de Cassandra 5.0.


Également publié ici .