如果您的建议在 2024 年仍然相似,那么您就做错了(恭敬地)。 以下是 2024 年矢量数据库领域的最新动态的总结。 1. 一种类型的推荐已经出来;平衡组已在 ❌ Out:仅提供 1 种搜索类型,如 Top-K。不要误会我的意思,top-K 是向量搜索的核心,但有时,它会推荐过于相似的项目,从而影响推荐质量。仅仅因为有人在悲伤的日子里听阿黛尔的歌,并不意味着他们想一直听她的歌。 ✅ 在:包含 通过允许您定义矢量相似性的距离范围,确保一组更加✨平衡✨的结果。平衡的推荐有助于防止推荐过于相似或过于不同的事物。 范围搜索 2. 向量归一化的额外步骤已经消失,使用余弦相似度已经出现 ❌ 输出:采取额外步骤 👎 标准化要测量的向量 (识别彼此传达相似含义的句子或短语)或各个领域的相关性。 相似 ✅ 在: 让您一步即可轻松标准化向量👍 余弦相似度 3、分步更新数据已经过时了;使用 Upsert 无缝完成它 ❌ Out:以令人沮丧的两步过程低效地更新数据库中的数据:删除,然后插入。这无法保证数据的原子性和操作的便利性。 ✅ 在: 简化更新过程:如果系统中不存在数据,则将其插入;如果存在,则会更新它。 😀 更新插入 4. 云提供商三合一(AWS、GCP 和 Azure)已然出现 ❌ 出局:矢量数据库在云提供商三合一上不可用:AWS、GCP 和 Azure。 ✅ 在:矢量数据库可在 3 个主要云提供商🌟(包括 GCP Marketplace)以及北美、欧洲和亚洲的 8 个区域👀 AKA 上使用 。 齐利兹云 在所有 3 个云平台上都提供矢量数据库的世界不再是想象的。 Zilliz Cloud 确实如此。 如果您有兴趣尝试范围搜索、更新插入和余弦相似度(在 3 个云平台中的任何一个上),请开始使用 。 这里 2 月 1 日还将举办一场实时网络研讨会,涵盖这些功能及更多内容。登记 。 这里 Discord 上还将有现场问答。加入我们 。 这里