paint-brush
Uma comparação entre distribuição de fontes e sobreposição de resultados em mecanismos de pesquisa na webpor@browserology
394 leituras
394 leituras

Uma comparação entre distribuição de fontes e sobreposição de resultados em mecanismos de pesquisa na web

Muito longo; Para ler

O estudo compara os resultados de pesquisa do Google, Bing, DuckDuckGo e Metager, revelando que o Google exibe mais domínios exclusivos nos principais resultados. Embora as principais fontes como a Wikipedia e sites de notícias dominem todos os mecanismos, o Metager mostra maior sobreposição com o Bing. Isso sugere que o uso de mecanismos de busca alternativos junto com o Google pode fornecer uma variedade maior de fontes e perspectivas para os usuários.
featured image - Uma comparação entre distribuição de fontes e sobreposição de resultados em mecanismos de pesquisa na web
Browserology: Study & Science of Internet Browsers HackerNoon profile picture
0-item

Autores:

(1) Yagci, Nurce, HAW Hamburgo, Alemanha & [email protected];

(2) Sünkler, Sebastian, HAW Hamburgo, Alemanha & [email protected];

(3) Häußler, Helena, HAW Hamburgo, Alemanha & [email protected];

(4) Lewandowski, Dirk, HAW Hamburgo, Alemanha & [email protected].

Tabela de Links

Resumo e introdução

Revisão da literatura

Objetivos e questões de pesquisa

Métodos

Resultados

Discussão

Conclusão, dados de pesquisa, agradecimentos e referências

ABSTRATO

Quando se trata de motores de busca, os usuários geralmente preferem o Google. Nosso estudo tem como objetivo encontrar as diferenças entre os resultados encontrados no Google em comparação com outros mecanismos de busca. Comparamos os 10 principais resultados do Google, Bing, DuckDuckGo e Metager, usando 3.537 consultas geradas no Google Trends da Alemanha e dos EUA. O Google exibe mais domínios exclusivos nos principais resultados do que seus concorrentes. A Wikipedia e os sites de notícias são as fontes mais populares em geral. Com algumas fontes principais dominando os resultados da pesquisa, a distribuição dos domínios também é consistente em todos os mecanismos de pesquisa. A sobreposição entre Google e Bing é sempre inferior a 32%, enquanto Metager tem uma sobreposição maior com Bing do que DuckDuckGo, chegando a 78%. Este estudo mostra que a utilização de outro mecanismo de busca, principalmente além do Google, proporciona maior variedade de fontes e pode levar o usuário a encontrar novas perspectivas.

PALAVRAS-CHAVE

Pesquisa na internet; mecanismo de busca; Raspagem da web; Google; comparação de fontes

INTRODUÇÃO

Por que deveria haver mais de um mecanismo de pesquisa? Embora os usuários possam preferir um mecanismo de busca a outros por sua usabilidade, recursos especializados ou uma integração mais conveniente em seu ambiente técnico, a questão que nos interessa nesta pesquisa é se um usuário se beneficiará do uso de outro mecanismo de busca que não o Google quando se trata de para encontrar resultados de diferentes fontes. O nosso ponto de partida é o facto de o Google ser, de longe, o motor de pesquisa mais utilizado (StatCounter, 2022), e de os utilizadores confiarem em grande medida nos motores de pesquisa para lhes fornecerem resultados relevantes e úteis (Comissão Europeia, 2016; Purcell et al., 2012), e que apenas alguns usuários utilizam outro mecanismo de busca além do Google (Schultheiß & Lewandowski, 2021).


Os usuários depositam grande confiança nos motores de busca. Isto reflecte-se nos 91% dos utilizadores dos EUA que afirmaram encontrar o que procuram sempre ou na maior parte do tempo, e nos 66% que acreditam que os motores de busca são uma fonte de informação justa e imparcial (Purcell et al., 2012). . Além disso, 78% dos utilizadores europeus da Internet e de plataformas online afirmaram confiar que os resultados dos seus motores de pesquisa são os resultados mais relevantes (Comissão Europeia, 2016). Globalmente, os utilizadores confiam nos motores de pesquisa mais do que em qualquer outra fonte (incluindo meios de comunicação tradicionais) quando se trata de notícias (Edelman Trust Institute, 2022) e os utilizadores confiam nas notícias encontradas através da pesquisa significativamente mais do que nas notícias encontradas nas redes sociais

(Newman et al., 2021).


Como a Web é enorme e diferentes mecanismos de pesquisa podem preferir fontes diferentes, é interessante ver se as principais fontes mostradas nos resultados da pesquisa diferem de um mecanismo de pesquisa para outro. Pode ser que um motor de busca alternativo prefira resultados de fontes “alternativas”, por exemplo, em termos de orientação política ou preferência por fornecedores de conteúdo não comercial. Tudo se resume a saber se os mecanismos de pesquisa alternativos são realmente alternativos em relação aos resultados que exibem. Se fossem, os possíveis benefícios de usar um mecanismo de pesquisa diferente do Google incluem encontrar resultados diferentes, encontrar resultados adicionais e encontrar resultados mais relevantes. Não importa qual desses objetivos o usuário pretenda alcançar, ele precisará de outros resultados além dos do Google. Portanto, é interessante ver se outros mecanismos de pesquisa fornecem tais resultados aos usuários.


Tem havido uma discussão contínua sobre motores de busca alternativos e como o domínio do Google no mercado de motores de busca pode ser quebrado. As abordagens vão desde o estabelecimento de motores de busca alternativos únicos até à construção de infraestruturas para essas alternativas (por exemplo, Lewandowski, 2019); ver também Mager, 2014). Com o Google dominando o mercado de mecanismos de busca (StatCounter, 2022), muitas vezes parece que não há alternativas. Por outro lado, o número de motores de busca alternativos (ou simplesmente “outros”) é frequentemente sobrestimado. Muitos mecanismos de pesquisa que parecem ser são apenas portais de pesquisa que exibem resultados de um parceiro, em vez de gerar os resultados a partir de seu próprio índice. Por exemplo, o Yahoo e a Ecosia obtêm os seus resultados do Bing e, portanto, não podem ser considerados motores de pesquisa por direito próprio. Mesmo assim, pode haver outras razões para usar um mecanismo de pesquisa sem índice próprio. Alguns dos benefícios exclusivos anunciados pelos mecanismos de busca alternativos são a privacidade (por exemplo, Startpage e DuckDuckGo) ou ser uma empresa que investe seus lucros em projetos ambientais (por exemplo, Ecosia). Outro tipo de mecanismo de busca é o metabuscador (por exemplo, Metager). Esse mecanismo envia as consultas para vários outros mecanismos de pesquisa e, em seguida, agrega e reclassifica os principais resultados. Consideramos especialmente interessante saber se tal abordagem conduzirá a uma maior variedade de resultados de pesquisa, ou seja, resultados de um conjunto mais diversificado de fontes. Assim, no contexto da nossa investigação, consideraremos qualquer motor de busca que tenha o seu próprio índice ou forneça uma selecção única e reclassificação de resultados de um ou mais índices como um motor de busca alternativo. Estamos especialmente interessados nas diferenças na distribuição da fonte; a relevância dos resultados está fora do escopo de nossa pesquisa.


Há mais de 20 anos, Introna e Nissenbaum (2000) argumentaram que os motores de busca, como operações comerciais, tendem a preferir grandes websites e, portanto, uma parte da Web, ou seja, os sites mais pequenos, permanecem ocultos. Estudos que medem o que os usuários selecionam parecem confirmar isso: Goel et al. (2010) descobriram que no Yahoo, apenas 10.000 sites respondem por aproximadamente 80% dos cliques em resultados. É importante notar que isto não resulta apenas da preferência do utilizador por fontes específicas, mas que os utilizadores selecionam predominantemente a partir dos principais resultados apresentados pelo motor de pesquisa. O que está fora da visão imediata dos usuários não será escolhido (Lewandowski & Kammerer, 2021).


É surpreendente que poucos estudos tenham comparado os resultados entre diferentes motores de busca nos últimos anos. Estudos mais antigos (ver seção de revisão da literatura) em geral descobriram que os principais resultados de diferentes mecanismos de pesquisa não se sobrepunham muito. Neste artigo abordamos como os principais resultados do Google diferem das alternativas e, portanto, se vale a pena para um usuário considerar essas alternativas. Se um motor de busca diferente do Google produzisse resultados muito semelhantes aos do Google, um utilizador não beneficiaria muito da utilização desse motor de busca quando se considera a variedade de fontes.


Este artigo está disponível no arxiv sob licença CC 4.0.

Imagem principal de Justin Morgan no Unsplash