paint-brush
Apache Cassandra 5.0 sắp ra mắt: Đây là lý do tại sao những người đã xây dựng nó được kích hoạttừ tác giả@datastax
1,255 lượt đọc
1,255 lượt đọc

Apache Cassandra 5.0 sắp ra mắt: Đây là lý do tại sao những người đã xây dựng nó được kích hoạt

từ tác giả DataStax6m2023/07/31
Read on Terminal Reader

dài quá đọc không nổi

Từ mặt nạ dữ liệu động đến các giao dịch ACID, các ủy viên của Apache Cassandra thảo luận về một số thay đổi lớn và thú vị trong bản phát hành 5.0 sắp tới.
featured image - Apache Cassandra 5.0 sắp ra mắt: Đây là lý do tại sao những người đã xây dựng nó được kích hoạt
DataStax HackerNoon profile picture
0-item
1-item


Hỏi ý kiến của tám người khác nhau và bạn sẽ nhận được tám câu trả lời khác nhau. Dự án nguồn mở Apache Cassandra được xây dựng và duy trì bởi một tập hợp các cá nhân, tất cả đều đến với động cơ riêng của họ. Một số yêu thích các tính năng mới. Một số thích vắt kiệt tất cả hiệu suất mà họ có thể ra khỏi hệ thống. Một số muốn làm cho cuộc sống của nhà điều hành dễ dàng hơn. Điều gì gắn kết tất cả chúng lại với nhau? Họ đang làm việc như một nhóm phân tán hướng tới một mục tiêu duy nhất: một cơ sở dữ liệu tuyệt vời không ngừng trở nên tốt hơn.


Cassandra là nỗ lực hợp tác của các kỹ sư từ các nơi khác nhau trên thế giới, những người có chung mục tiêu là tạo ra sản phẩm tốt nhất có thể. Họ giải quyết các vấn đề cho người sử dụng lao động của họ trong khi đóng góp vào mã nguồn mở cho dự án. Những người giành được sự tin tưởng của cộng đồng và có thể thực hiện các thay đổi đối với mã cơ sở được gọi là “người cam kết”. Trở thành một người cam kết đòi hỏi sự cống hiến và đam mê cho dự án. Mới đây, dự án đã tổ chức sự kiện mang tên Chuyển tiếp Cassandra , nơi một số thành viên đã chia sẻ hiểu biết của họ về bản phát hành sắp tới của Cassandra 5.0. Đây là những gì họ đã nói.


John Haddad : Hỗ trợ Java 17 và trình thu gom rác

Haddad cho chúng tôi biết anh ấy mong được hỗ trợ cho Java 17 và các trình thu gom rác có độ trễ thấp như ZGC trong Cassandra 5.0. Nhà phát triển cũ của Netflix và Apple, người đã từng là người chuyển giao Cassandra từ năm 2017, cho biết những người thu thập này sẽ cung cấp thời gian tạm dừng dưới một phần nghìn giây và mô hình "thiết lập và quên", giúp việc quản lý bộ nhớ bớt quá tải hơn đối với người dùng Cassandra. Khi dự án hoàn thiện và việc quản lý bộ nhớ trở nên tốt hơn, sẽ có những cải tiến về thời lượng và tần suất tạm dừng GC, giúp dễ dàng chạy các nút dày đặc hơn, giúp tiết kiệm tiền cho người dùng.


“Điều đó có nghĩa là chúng ta sẽ thấy các lần tạm dừng GC ít thường xuyên hơn — và khi chúng xảy ra, chúng sẽ mất ít thời gian hơn. Điều này sẽ giúp việc chạy các nút dày đặc hơn trở nên dễ dàng hơn, nghĩa là việc chạy cụm của bạn sẽ ít tốn kém hơn. Tôi thích ý tưởng tiết kiệm tiền chỉ bằng cách nâng cấp.”


Andrés de la Peña : Mặt nạ dữ liệu động

De la Peñ a, một kỹ sư phần mềm DataStax và là người chuyển giao Cassandra từ năm 2016, rất hào hứng với tính năng che dấu dữ liệu động trong Cassandra 5.0, cho phép che giấu thông tin nhạy cảm trong khi vẫn cho phép truy cập vào các cột được che dấu. Tính năng này thay thế các giá trị thực của các cột bằng dữ liệu chung bằng cách sử dụng một loạt các hàm SQL thông thường để biến đổi các giá trị ô. Quản trị viên có thể đính kèm các hàm che này vào các cột của lược đồ bảng, vì vậy người dùng không có đặc quyền sẽ luôn thấy dữ liệu bị che, ngay cả khi họ không chỉ định các hàm trong truy vấn. Hiện tại, tập hợp các chức năng tạo mặt nạ có sẵn tương đối ít, nhưng người dùng có thể sử dụng các chức năng do người dùng xác định của riêng họ để tạo mặt nạ, giúp dễ dàng thêm các loại mặt nạ tùy chỉnh.


“Đó là một tính năng ẩn danh bảo mật có sẵn trong nhiều cơ sở dữ liệu ngoài kia

và đã quá hạn ở Cassandra.”


Vinay Chella : lan can

Chella, lãnh đạo kỹ thuật cấp cao tại Netflix và là người cam kết từ năm 2019, rất hào hứng với các tính năng mới trong Cassandra 5.0. Các tính năng này mang lại nhiều biện pháp bảo vệ hơn cho các nhà phát triển, cải thiện tính ổn định và nâng cao trải nghiệm vận hành. Việc giới thiệu lan can trong Cassandra 4.1 cho phép giới hạn mềm và cứng đối với hành động của người dùng và Cassandra 5.0 bổ sung một số lan can mới để tăng độ tin cậy, tính khả dụng và trải nghiệm người dùng. Những lan can này hệ thống hóa các phương pháp hay nhất và tránh những sai lầm nghiêm trọng, chẳng hạn như bỏ sót các khoảng trống quan trọng trong sản xuất hoặc mất dữ liệu.


“Những lan can này chắc chắn giúp ngăn chặn rất nhiều khoảnh khắc ‘oops’ này.”


Mick Semb Wever : Cộng đồng

Semb Weaver, một người chuyển giao Cassandra từ năm 2016 và là kiến trúc sư chính tại DataStax, đánh giá cao cách Cassandra 5.0 thể hiện “nguồn mở thực sự” bằng cách có nhiều nhà cung cấp, công ty và nhân viên đứng sau những người đóng góp. Điều này tạo ra một cộng đồng phát triển đa dạng với tập hợp các tính năng và ứng dụng phong phú, đồng thời nhấn mạnh tầm quan trọng của việc vệ sinh kỹ thuật, xây dựng QA và CI để cải thiện độ tin cậy và kích hoạt các tính năng cơ bản. Ông nói rằng những nguyên tắc và thực tiễn này sẽ dẫn đến tuổi thọ, tính bền vững và hiện đại hóa của công nghệ cao hơn, đồng thời khuyến khích sự đa dạng và hợp tác trong cộng đồng.


“Đó là thứ cho phép một số tính năng cấp tiến sắp có trong phiên bản 5.0 — chẳng hạn như Accord — mà chúng ta không thể vượt qua vạch đích nếu tất cả chúng ta không làm việc cùng nhau như một nhóm.”


Tây Jordan : Ngủ nhiều hơn!

West, một kỹ sư phần mềm cấp cao của Netflix và là Người ủy quyền của Cassandra từ năm 2020, rất vui mừng về cách những cải tiến trong Cassandra 5.0 sẽ dẫn đến độ tin cậy và hiệu suất tốt hơn, giúp anh ấy có nhiều giấc ngủ hơn với tư cách là một kỹ sư trực ca. Anh ấy nêu bật tính năng siêu dữ liệu giao dịch mới và các bảng ghi nhớ được cải tiến sẽ cho phép ghi nhiều hơn và nhanh hơn. Ông cũng mô tả cách các bảng ảo, chẩn đoán và số liệu mới sẽ cung cấp thông tin chi tiết hơn về Cassandra và giúp giải quyết sự cố nhanh hơn.


“Tôi biết với Cassandra 5.0 [rằng] khi tôi đi ngủ, tôi ít có khả năng bị đánh thức hơn — và khi đó, tôi sẽ giải quyết vấn đề nhanh hơn và quay lại giường ngủ nhanh hơn.”


Ekaterina Dimitrova : Giao dịch phù hợp và ACID

Là một kỹ sư DataStax, người đã trở thành người đi làm từ năm 2020, Dimitrova đang háo hức mong đợi việc cộng đồng triển khai giao thức Accord. Giao thức này sẽ cho phép sự đồng thuận toàn cầu và cho phép các giao dịch ACID được thực hiện trên quy mô lớn, giúp các nhà phát triển làm việc hiệu quả hơn mà không ảnh hưởng đến hiệu suất hoặc khả năng mở rộng. Sự đồng thuận toàn cầu là rất quan trọng trong những thứ như chuyển khoản ngân hàng; đảm bảo đồng thời đảm bảo rằng chỉ một quy trình có thể thực hiện thay đổi tại một thời điểm. Cú pháp mới mà chúng tôi đang tạo cho các nhà phát triển sẽ bao gồm các khai báo giao dịch bắt đầu và cam kết, cho phép tất cả các hoạt động trong khai báo hoàn toàn tuân thủ ACID.


Lorina Ba Lan: Chiến lược nén thống nhất

Ba Lan, một nhà lãnh đạo công nghệ của DataStax, người đã trở thành người chuyển giao vào năm 2021, thích những lợi ích của Chiến lược nén thống nhất (UCS) của Cassandra 5.0, kết hợp các chiến lược nén cũ như CT, chiến lược nén theo cấp độ và kích thước. UCS là một chiến lược nén nhanh hơn đáng kể giúp giảm chi phí không gian và cho phép xử lý song song. Chiến lược này cũng có một hệ số mở rộng có thể được điều chỉnh theo khối lượng công việc cụ thể, cho dù chúng nặng về đọc hay ghi, hoặc cả hai. Không cần biết các chiến lược kế thừa hoạt động như thế nào và không có chi phí chung để di chuyển sang UCS.


“Nếu bạn cần nó viết nhiều, bạn có thể điều chỉnh nó theo điều đó; nếu bạn cần nó nặng về mặt đọc, bạn có thể điều chỉnh nó; và nếu bạn chỉ muốn một cái gì đó ở giữa, nó sẽ hoạt động tốt cho bất kỳ khối lượng công việc nào của bạn.”


Benjamin Lerer : Lập chỉ mục lưu trữ đính kèm

Lerer đã trở thành một người đi làm tám năm trước. Trưởng nhóm công nghệ DataStax lưu ý rằng chỉ số phụ gắn liền với bộ lưu trữ (SASI) đã được thêm vào năm 2016, nhưng không được đầu tư đủ và phải đưa ra thị trường thử nghiệm trong Cassandra 4.0 vì nó không đáp ứng các tiêu chuẩn mong muốn. SAI đã được xây dựng dựa trên SASI và có bộ cải tiến riêng, bao gồm khả năng lập chỉ mục nhiều cột mà không gặp vấn đề về khả năng mở rộng và tối ưu hóa cho việc sử dụng không gian và truy vấn xử lý số.


“SAI sẽ kích hoạt một tập hợp các khả năng truy vấn mới mà không có nhược điểm mà việc lập chỉ mục phụ hoặc SASI gặp phải.”


Branimir Lambov : Khả năng cắm

Lambov, một kỹ sư DataStax, người đã từng là người chuyển giao Cassandra từ năm 2015, rất hào hứng với khả năng cắm bộ nhớ cục bộ trong Cassandra 5.0. Thay đổi xoay quanh memtable, là vùng lưu trữ tạm thời trong bộ nhớ của máy tính, nơi dữ liệu được lưu trữ trước khi được ghi vào bộ lưu trữ lâu dài hơn. Mục tiêu của việc triển khai mới là giúp sử dụng các loại bảng ghi nhớ khác nhau dễ dàng hơn và chọn loại tốt nhất cho từng trường hợp sử dụng cụ thể. Một trong những triển khai mới dựa trên một Trie cấu trúc dữ liệu, cung cấp một cách lưu trữ dữ liệu hiệu quả hơn nhiều. Nó cũng cho phép bộ nhớ được sử dụng ngoài heap Java chính, dẫn đến không có bộ sưu tập rác cho các hoạt động lưu trữ. Những cải tiến này có thể tăng gấp đôi thông lượng ghi của cơ sở dữ liệu. Sẽ rất thú vị để xem cộng đồng sẽ sử dụng giao diện lưu trữ linh hoạt này ở đâu tiếp theo.


Trong OSS, mọi người tạo ra sự khác biệt

Khám phá một dự án nguồn mở thành công là một hành trình hấp dẫn, từ cả quan điểm con người và công nghệ. Mặc dù công nghệ có thể là trọng tâm ban đầu của một dự án phần mềm, nhưng chính những người liên quan mới làm cho nó thực sự hấp dẫn. Mỗi người mang những cảm xúc và mong muốn độc đáo của họ đến bàn, điều này có thể dẫn đến kết quả tích cực hoặc tiêu cực. Trong một dự án mã nguồn mở, mong muốn của các cá nhân để cải thiện một cái gì đó được đặt ra và sẵn sàng cho những lời chỉ trích. Tuy nhiên, chính nhờ quyết tâm làm việc cùng nhau và tiến về phía trước mà điều kỳ diệu thực sự của dự án đã xuất hiện.


Bạn đang mong đợi những tính năng nào trong Cassandra 5.0? Cá nhân tôi rất vui vì những cải tiến dành cho nhà phát triển sẽ thay đổi cuộc chơi, chẳng hạn như giao dịch ACID, sơ đồ lập chỉ mục mới và cú pháp mới như toán tử NOT. Với tư cách là một người đi làm của Cassandra, tôi thích xem các nhà phát triển sử dụng các tính năng mới này và tạo ra những thứ tuyệt vời. Nếu bạn chưa kiểm tra Cassandra trong một thời gian, thì bây giờ là thời điểm tốt để làm điều đó. Tham gia phần còn lại của cộng đồng người dùng tại Hành tinh Cassandra và chia sẻ suy nghĩ của bạn về những điều khiến bạn phấn khích về Cassandra 5.0.


Cũng được xuất bản ở đây .