paint-brush
Apache Cassandra: Cơ sở dữ liệu giúp Uber và Apple giảm thiểu rủi ro cho các dự án AI của họtừ tác giả@datastax
1,204 lượt đọc
1,204 lượt đọc

Apache Cassandra: Cơ sở dữ liệu giúp Uber và Apple giảm thiểu rủi ro cho các dự án AI của họ

từ tác giả DataStax4m2023/08/07
Read on Terminal Reader

dài quá đọc không nổi

Những người dùng Cassandra quy mô lớn, như Uber và Apple, minh họa cách hệ thống cơ sở dữ liệu này có thể giảm rủi ro một cách hiệu quả trong các dự án AI/ML.
featured image - Apache Cassandra: Cơ sở dữ liệu giúp Uber và Apple giảm thiểu rủi ro cho các dự án AI của họ
DataStax HackerNoon profile picture
0-item
1-item


Cơn sóng thần trí tuệ nhân tạo gần đây đã tạo ra rất nhiều áp lực phải di chuyển nhanh chỉ để theo kịp. Một số có thể có xu hướng hy sinh sự ổn định và chất lượng để chạy nhanh với các công cụ tiên tiến nhất. Hạnh phúc, nó không phải là cách đó.


Trong thế giới AI và máy học (AI/ML), việc lựa chọn cơ sở dữ liệu có thể ảnh hưởng đáng kể đến sự thành công của dự án của bạn. Một trong những yếu tố chính cần xem xét là rủi ro liên quan đến khả năng mở rộng và độ tin cậy của hệ thống cơ sở dữ liệu. Apache Cassandra, một cơ sở dữ liệu phân tán có hiệu suất cao và khả năng mở rộng cao, đã chứng tỏ là công ty hàng đầu trong lĩnh vực này. Nó cung cấp các tính năng giúp giảm đáng kể rủi ro liên quan đến các dự án AI/ML, khiến nó trở thành lựa chọn ưa thích của nhiều tổ chức.


Những người dùng Cassandra trên quy mô lớn, như UberApple , minh họa cách hệ thống cơ sở dữ liệu này có thể giảm thiểu rủi ro một cách hiệu quả trong các dự án AI/ML. Uber sử dụng Cassandra để xử lý dữ liệu theo thời gian thực và để giữ cửa hàng tính năng trực tiếp trong Cassandra để dự đoán. Khả năng bắt đầu từ quy mô nhỏ và mở rộng quy mô khi cần, cùng với độ tin cậy cao, cho phép Uber quản lý lượng dữ liệu khổng lồ mà không gặp rủi ro về lỗi hệ thống hoặc suy giảm hiệu suất. Nhiều hệ thống mới hơn được xây dựng cho khối lượng công việc AI đang cố gắng xây dựng khả năng mở rộng xung quanh một tính năng cụ thể, nhưng những người dùng sử dụng AI trên quy mô lớn đã sử dụng Cassandra trong nhiều năm.


Khả năng mở rộng và hiệu suất

Các ứng dụng AI/ML thường xử lý lượng dữ liệu khổng lồ và yêu cầu xử lý tốc độ cao. Lập kế hoạch khi bạn cần năng lực là một nhiệm vụ khó khăn. Kế hoạch tốt nhất? Chỉ cần tránh nó. Thay vào đó, hãy sử dụng một cơ sở dữ liệu có thể thay đổi quy mô nhanh chóng khi bạn cần và không bao giờ khiến bạn bị thừa dung lượng dự phòng.


Khả năng cốt lõi của Cassandra là mở rộng quy mô theo chiều ngang vẫn khiến nó khác biệt với nhiều cơ sở dữ liệu khác. Khi dữ liệu của bạn tăng lên, bạn có thể thêm nhiều nút hơn vào cụm Cassandra để xử lý lưu lượng truy cập và dữ liệu tăng lên. Nó chỉ đơn giản vậy thôi. Tính năng này đặc biệt quan trọng đối với các ứng dụng AI/ML, ứng dụng xử lý các tập dữ liệu ngày càng tăng.


Uber là một công ty siêu quy mô và mỗi sản phẩm mới mà nó giới thiệu đều tiếp tục đẩy các yêu cầu về quy mô của nó đi xa hơn. Là một trong những người dùng lớn nhất của Cassandra, nó tận dụng khả năng mở rộng này để xử lý nhu cầu dữ liệu ngày càng tăng và thay đổi của nó. Thông lượng ghi và đọc cao của Cassandra khiến nó trở thành một lựa chọn tuyệt vời để xử lý dữ liệu thời gian thực cần thiết trong các ứng dụng AI và ML của nó.


xử lý thời gian thực

Xử lý dữ liệu thời gian thực là một yêu cầu quan trọng đối với bất kỳ ứng dụng hiện đại nào. Một phần nghìn giây được tính khi người dùng đang tìm kiếm trải nghiệm tốt nhất. Các ứng dụng AI/ML thường cần phân tích và phản hồi dữ liệu khi dữ liệu đến, cho dù đó là đề xuất theo thời gian thực, phân tích dự đoán hay mô hình định giá động. Cassandra, với thông lượng ghi và đọc cao, rất phù hợp với các yêu cầu xử lý thời gian thực như vậy. Kiến trúc của Cassandra cho phép nó xử lý khối lượng dữ liệu lớn trên nhiều máy chủ hàng hóa, mang lại tính sẵn sàng cao mà không có điểm lỗi nào. Điều này có nghĩa là dữ liệu có thể được ghi và đọc từ cơ sở dữ liệu gần như ngay lập tức, làm cho nó trở thành lựa chọn tuyệt vời cho các ứng dụng yêu cầu phản hồi theo thời gian thực.


Uber Eats là một ví dụ thực tế. Ứng dụng cần xử lý dữ liệu theo thời gian thực để cung cấp cho bạn các đề xuất về thực phẩm và thời gian giao hàng ước tính. Quá trình xử lý thời gian thực này có thể thực hiện được nhờ hiệu suất cao của Cassandra. Không chỉ vậy, sao chép mặc định làm cho các lỗi cơ sở hạ tầng trở nên minh bạch đối với người dùng cuối, giúp họ hài lòng và sử dụng ứng dụng. Dòng dữ liệu thay đổi liên tục và chu kỳ sử dụng hoang dã là nơi Cassandra tỏa sáng. Các tổ chức sử dụng Cassandra dành nhiều thời gian hơn để lo lắng về các tính năng phù hợp của ứng dụng và ít lo lắng hơn về cơ sở dữ liệu hỗ trợ chúng.


Tiến ra toàn cầu với dữ liệu

Với Cassandra, dữ liệu được tự động sao chép sang nhiều nút và các bản sao này cung cấp dự phòng. Nếu một nút bị lỗi, dữ liệu vẫn có thể được truy cập từ các bản sao. Tính năng này đảm bảo rằng các ứng dụng AI/ML của bạn vẫn hoạt động, ngay cả khi gặp lỗi phần cứng hoặc sự cố mạng.


Nhưng kiến trúc phân tán của Cassandra không chỉ góp phần tạo ra khả năng chịu lỗi cao mà còn giúp bạn luôn gần gũi với người dùng của mình. Một số người dùng gần như coi việc sao chép dữ liệu toàn cầu mặc định của nó là điều hiển nhiên.


Các công ty như Apple và Netflix đã nói về kiến trúc hoạt động tích cực của họ trải rộng trên nhiều khu vực địa lý trên khắp thế giới trong một thời gian dài đến nỗi điều đó thậm chí không có gì lạ. Bên cạnh khả năng chịu lỗi, khía cạnh lấy người dùng làm trung tâm của khả năng tuyệt vời này là định vị dữ liệu. Nếu bạn có người dùng ở Bắc Mỹ, Châu Á và Châu Âu, việc tập trung dữ liệu vào một vị trí sẽ dẫn đến độ trễ khó chịu cho một số nhóm nhỏ người dùng của bạn. Giải pháp là chỉ sao chép dữ liệu vào từng vị trí và cung cấp cho mọi người một cửa sổ độ trễ ngắn cho dữ liệu.


Loại bỏ rủi ro cho dự án của bạn

Chọn ngăn xếp công nghệ phù hợp là một phần quan trọng trong việc loại bỏ rủi ro cho bất kỳ dự án nào. Với Cassandra, bạn có thể bắt đầu với quy mô nhỏ và mở rộng quy mô khi cần, mang đến giải pháp tiết kiệm chi phí cho dự án của bạn. Cassandra đã chứng minh được độ tin cậy của nó theo thời gian, với một số công ty đã chạy các cụm Cassandra của họ trong hơn 10 năm mà không tắt chúng. Công nghệ mới hơn với các tính năng được phát triển riêng cho AI đang được thêm vào, nhưng một số khối lượng công việc AI/ML nặng nhất đã được quản lý lặng lẽ và nhất quán với Cassandra trong một thời gian khá dài. Điều đó nói rằng, ngày nay nó đang trở thành một lựa chọn phù hợp hơn cho khối lượng công việc AI/ML.


Khả năng mở rộng, hiệu suất, khả năng xử lý thời gian thực và tuổi thọ của Cassandra đã khiến nó trở thành lựa chọn tuyệt vời cho các ứng dụng AI/ML. Khi các ứng dụng AI tiếp tục phát triển và ngày càng trở nên không thể thiếu trong hoạt động kinh doanh, nhu cầu về cơ sở dữ liệu mạnh mẽ, đáng tin cậy và hiệu quả như Cassandra sẽ ngày càng tăng. Khi chọn Cassandra, bạn không chỉ chọn một cơ sở dữ liệu; bạn đang chứng minh cho các ứng dụng AI/ML của mình trong tương lai.


Tìm hiểu cách các cơ sở dữ liệu vectơ như Cassandra và DataStax Astra DB hỗ trợ các dự án AI tổng hợp quy mô lớn


Bởi Patrick McFadin, DataStax .


Cũng được xuất bản ở đây.