paint-brush
4 prós e contras de 2024: edição de banco de dados vetorialpor@zilliz
502 leituras
502 leituras

4 prós e contras de 2024: edição de banco de dados vetorial

por Zilliz2m2024/01/31
Read on Terminal Reader

Muito longo; Para ler

Se suas recomendações ainda forem semelhantes em 2024, você está fazendo errado (respeitosamente). Aqui está um resumo do que está dentro e fora do mundo dos bancos de dados vetoriais em 2024. Um tipo de recomendação acabou, um conjunto equilibrado está dentro. Tríade de provedores de nuvem: AWS, GCP e Azure.
featured image - 4 prós e contras de 2024: edição de banco de dados vetorial
Zilliz HackerNoon profile picture
0-item

Se suas recomendações ainda forem semelhantes em 2024, você está fazendo errado (respeitosamente).


Aqui está um resumo do que está dentro e fora do mundo dos bancos de dados vetoriais em 2024.


1. Foi lançado um tipo de recomendação; um conjunto balanceado está presente

❌ Out: oferece apenas 1 tipo de busca como Top-K. Não me interpretem mal, o top-K é fundamental para a pesquisa vetorial, mas às vezes fornece recomendações de itens muito semelhantes, afetando a qualidade da recomendação. Só porque alguém ouve Adele nos dias tristes, não significa que queira ouvi-la o tempo todo.


✅ Em: A inclusão de pesquisa de intervalo garante um conjunto de resultados mais ✨equilibrado✨, permitindo definir um intervalo de distância para similaridade vetorial. Recomendações equilibradas ajudam a evitar recomendações muito semelhantes ou muito díspares.


2. Etapas extras para normalizar vetores foram eliminadas, usando similaridade de cosseno

❌ Fora: Dando um passo extra 👎para normalizar um vetor para medir semelhança (identificar sentenças ou frases que transmitem significados semelhantes entre si) ou parentesco em vários domínios.


✅ Em: Semelhança de cosseno permitindo que você normalize facilmente um vetor em uma única etapa 👍

3. A atualização de dados em várias etapas foi encerrada; Usar o Upsert para fazer isso perfeitamente está na moda

❌ Fora: atualização ineficiente de dados em um banco de dados em um processo frustrante de 😡duas etapas: excluir e inserir. Isso não pode garantir a atomicidade dos dados e a conveniência operacional.


✅ Em: Upsert simplifica o processo de atualização: caso não existam dados no sistema, ele os insere; se existir, ele o atualiza. 😀

4. A tríade do provedor de nuvem (AWS, GCP e Azure) está na moda

❌ Fora: Bancos de dados vetoriais não disponíveis na tríade de provedores de nuvem: AWS, GCP e Azure.


✅ In: bancos de dados vetoriais disponíveis em três principais provedores de nuvem 🌟(incluindo GCP Marketplace) e 8 regiões na América do Norte, Europa e Ásia 👀 Também conhecido como Nuvem Zilliz .


Um mundo com um banco de dados vetorial disponível em todas as três plataformas de nuvem não é mais imaginativo. É verdade com Zilliz Cloud.


Se você estiver interessado em experimentar pesquisa de intervalo, upsert e similaridade de cosseno (em qualquer uma das três plataformas de nuvem), comece aqui .


Haverá também um webinar ao vivo cobrindo esses recursos e muito mais no dia 1º de fevereiro. Registro aqui .


Haverá também uma sessão de perguntas e respostas ao vivo no Discord. Junte-se a nós aqui .