paint-brush
4 thông tin chi tiết về năm 2024: Phiên bản cơ sở dữ liệu vectơtừ tác giả@zilliz
502 lượt đọc
502 lượt đọc

4 thông tin chi tiết về năm 2024: Phiên bản cơ sở dữ liệu vectơ

từ tác giả Zilliz2m2024/01/31
Read on Terminal Reader

dài quá đọc không nổi

Nếu các đề xuất của bạn vẫn tương tự vào năm 2024 thì bạn đã làm sai (một cách tôn trọng) Dưới đây là bản tóm tắt về những gì có trong và ngoài thế giới cơ sở dữ liệu vectơ vào năm 2024. Một loại đề xuất bị loại bỏ, một bộ cân bằng sẽ được đưa vào. bộ ba nhà cung cấp đám mây: AWS, GCP và Azure.
featured image - 4 thông tin chi tiết về năm 2024: Phiên bản cơ sở dữ liệu vectơ
Zilliz HackerNoon profile picture
0-item

Nếu các đề xuất của bạn vẫn tương tự vào năm 2024 thì bạn đã làm sai (một cách đáng trân trọng).


Dưới đây là bản tóm tắt về những gì xảy ra trong thế giới cơ sở dữ liệu vectơ vào năm 2024.


1. Đã loại bỏ một loại khuyến nghị; một bộ cân bằng đã được đưa vào

❌ Out: chỉ cung cấp 1 loại tìm kiếm như Top-K. Đừng hiểu sai ý tôi, top-K là cốt lõi của tìm kiếm vectơ, nhưng đôi khi, nó đưa ra đề xuất về các mục quá giống nhau, ảnh hưởng đến chất lượng đề xuất. Chỉ vì ai đó lắng nghe Adele trong những ngày buồn, điều đó không có nghĩa là họ muốn lắng nghe cô ấy mọi lúc.


✅ Trong: Sự bao gồm của tìm kiếm phạm vi đảm bảo tập hợp kết quả ✨cân bằng✨ hơn bằng cách cho phép bạn xác định phạm vi khoảng cách cho độ tương tự của vectơ. Các đề xuất cân bằng giúp ngăn chặn việc đề xuất những thứ quá giống hoặc quá khác biệt.


2. Các bước bổ sung để chuẩn hóa vectơ đã bị loại bỏ, sử dụng tính tương tự Cosine đã được đưa vào

❌ Out: Tiến thêm một bước 👎để chuẩn hóa vector cần đo sự giống nhau (xác định các câu hoặc cụm từ truyền đạt ý nghĩa tương tự nhau) hoặc mối liên quan trong các lĩnh vực khác nhau.


✅ Tại: Độ tương tự cosin cho phép bạn dễ dàng chuẩn hóa một vectơ trong một bước 👍

3. Không cập nhật dữ liệu theo nhiều bước; Sử dụng Upsert để làm điều đó một cách liền mạch

❌ Out: Cập nhật dữ liệu trong cơ sở dữ liệu không hiệu quả trong một quy trình gồm hai bước khó chịu: xóa, sau đó chèn. Điều này không thể đảm bảo tính nguyên tử của dữ liệu và sự thuận tiện trong vận hành.


✅ Tại: Upsert đơn giản hóa quá trình cập nhật: nếu dữ liệu không tồn tại trong hệ thống, nó sẽ chèn dữ liệu đó; nếu nó tồn tại, nó sẽ cập nhật nó. 😀

4. Bộ ba nhà cung cấp đám mây (AWS, GCP và Azure) đang hoạt động

❌ Không có: Cơ sở dữ liệu vectơ không có sẵn trên bộ ba nhà cung cấp đám mây: AWS, GCP và Azure.


✅ Trong: Cơ sở dữ liệu vectơ có sẵn trên 3 nhà cung cấp đám mây lớn 🌟 (bao gồm GCP Marketplace) và 8 khu vực trên khắp Bắc Mỹ, Châu Âu và Châu Á 👀 AKA Đám Mây Zilliz .


Một thế giới với cơ sở dữ liệu vector có sẵn trên cả 3 nền tảng đám mây không còn là điều xa vời nữa. Điều đó đúng với Zilliz Cloud.


Nếu bạn quan tâm đến việc thử tìm kiếm theo phạm vi, upsert và độ tương tự cosine (trên bất kỳ nền tảng nào trong số 3 nền tảng đám mây), hãy bắt đầu đây .


Ngoài ra còn có hội thảo trực tuyến bao gồm các tính năng này và hơn thế nữa vào ngày 1 tháng 2. Đăng ký đây .


Cũng sẽ có phần hỏi đáp trực tiếp trên Discord. Tham gia với chúng tôi đây .